<?xml version="1.0"?>
<?xml-stylesheet type="text/css" href="http://www.cslt.org/mediawiki/skins/common/feed.css?303"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh-cn">
		<id>http://www.cslt.org/mediawiki/index.php?action=history&amp;feed=atom&amp;title=%E6%96%87%E4%BB%B6%3ANews_research_900.xlsx</id>
		<title>文件:News research 900.xlsx - 版本历史</title>
		<link rel="self" type="application/atom+xml" href="http://www.cslt.org/mediawiki/index.php?action=history&amp;feed=atom&amp;title=%E6%96%87%E4%BB%B6%3ANews_research_900.xlsx"/>
		<link rel="alternate" type="text/html" href="http://www.cslt.org/mediawiki/index.php?title=%E6%96%87%E4%BB%B6:News_research_900.xlsx&amp;action=history"/>
		<updated>2026-04-07T00:34:03Z</updated>
		<subtitle>本wiki的该页面的版本历史</subtitle>
		<generator>MediaWiki 1.23.3</generator>

	<entry>
		<id>http://www.cslt.org/mediawiki/index.php?title=%E6%96%87%E4%BB%B6:News_research_900.xlsx&amp;diff=23174&amp;oldid=prev</id>
		<title>Baizw：我们根据http://top.chinaz.com/hangye/index_news.html  上的新闻网站排名对现有的新闻网站做了一下调研。排名中共有1900余个网站，因为排名靠后的网站大多更新量较少或已经关闭，因此我们只调研了...</title>
		<link rel="alternate" type="text/html" href="http://www.cslt.org/mediawiki/index.php?title=%E6%96%87%E4%BB%B6:News_research_900.xlsx&amp;diff=23174&amp;oldid=prev"/>
				<updated>2016-10-24T12:37:26Z</updated>
		
		<summary type="html">&lt;p&gt;我们根据http://top.chinaz.com/hangye/index_news.html  上的新闻网站排名对现有的新闻网站做了一下调研。排名中共有1900余个网站，因为排名靠后的网站大多更新量较少或已经关闭，因此我们只调研了...&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新页面&lt;/b&gt;&lt;/p&gt;&lt;div&gt;我们根据http://top.chinaz.com/hangye/index_news.html  上的新闻网站排名对现有的新闻网站做了一下调研。排名中共有1900余个网站，因为排名靠后的网站大多更新量较少或已经关闭，因此我们只调研了前900个网站（包括所有的电子报，因为大部分电子报网站可用并且结构单一）。附件中是调研结果，灰色的是已经爬取的，绿色的是可用的，蓝色的是新闻量较少的（少于100M），橘黄色的是动态网页（爬取复杂 数据量不易预估），红色的是不可用的（英文、繁体字、视频广播网站、其他网站中包含的新闻页等），红色填充的是网址有问题的网站。其中可用网站有292个，我们决定先爬绿色标注中数据量大于1G的网站，太少的网站工作量又大结果又少，暂时不予考虑。大于1G的网站大约有40多个，数据量在60-80G左右。如果爬取完成后还需要更多新闻网站，我们可以再解析500M-1G的网站。&lt;/div&gt;</summary>
		<author><name>Baizw</name></author>	</entry>

	</feed>