百度新闻源:漫长的收录等待

bomny,2009年8月25日

  申请百度新闻源需要多长时间:两个月左右(同事说的另一个网_站),自己的实验进行中(三周左右时间)。
  申请动机:为网_站带来更多流量
  申请方法: 《互联网_新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准,网_站可将发布的新闻内容制作成遵循此开放协议的XML格式的网_页(独立于原有的新闻发布形式)供搜索引擎索引。
  http://news.baidu.com/newsop.html
  申请时间:2009年8月12日(待审核)--> 2009年8月24日(测试)--> 2009年9月2日(审核已通过)-->
  申请通过时间:2009年9月2日
  网_站背景:行业垂直门户网_站,申请百度收录某栏目为新闻源
  栏目更新:周一至周五每天有10条左右的资讯更新,周末周日无更新
  xml生成方式:无重新开发,直接通过cms实现。

  其他:
  1、怎么告诉搜索引擎网_站的内容?
  google:通过webmaster工具提交sitemap或者rss。
  单个网_址提交:http://www.google.com/addurl/
  baidu:申请成为新闻源。
  单个网_址提交:http://www.baidu.com/search/url_submit.html

  2、怎么得知搜索引擎的收录情况?
  google:通过webmaster工具,可以查看提交的sitemap中被收录的页面数及sprider的访问情况。
  baidu:等、很辛苦的等。不知道收录要多长时间,不知道等待审核啥时候会变成下一个状态,不知道测试的下一个状态是啥,更不知道测试状态要等多久才会变。

  3、google vs baidu
  baidu坚信他可以抓取到世界上任何一个可以公开访问的网_页,不需要其他人过多帮助;
  google理解,如果有站长的帮助,他们能够更快的找到最新的内容。
  各自的工具条都可以帮助收集一些网_页链接信息,而我们也更愿意去安装同样信任我们的人。

  4、什么时好的扩展性?
  说这个的目的是感谢正在使用的cms系统,细节处方显真功夫。
  在看baidu说明的时候说需要提交一个可以自动更新的xml文件,是在不想去麻烦开发同事,况且不是自己的系统,没人愿意因为这点小事去研究cms。
  最后发现可以通过现有功能变通实现:需要的xml文件其实就是一个类似于文章列表的东西,是不是可以利用栏目列表页生成的,查看模板部分后,大喜,生成文件的扩展名竟然可以自定义,不管是html,shtml,asp,php,哪怕txt,exe都可以随便写,我把扩展名设成xml不就OK,伟大的cms系统,伟大的自定义扩展名功能。自动更新就简单了,一般的发布系统都会有定时发布功能,按照需要设置就行。我设置的时工作时间12分钟更新一次,xml里的时间是15分钟,如果内容有更新的话15分钟内就可以百度发现,有点喜出望外了。

  您提交的XML文件目前的状态是:待审核
  您提交的XML文件目前的状态是:待审核


  您提交的XML文件目前的状态是:测试
  您提交的XML文件目前的状态是:测试

Tags: 百度  CMS  google  

分类: 胡言乱语 | 评论:1 | 浏览:

相关文章: