真正超强的无rss源订阅feed43工具

上次我发布过一篇教程,如何订阅无rss源的网站,利用的是ponyfish工具,比较简单方便,可惜这个工具目前已经不行了,于是狠下心来再次试一下feed43工具,因为上次由于有更方便的工具,所以没去研究这个feed43,草草的设置发现不行就丢弃了,今天再次进入feed43,终于把我想要订阅的这个阿根廷华人网站的新闻给搞定了。

为什么有些网站不提供rss源?一是为了争取流量,二是为了防止采集!

我觉得这个工具制作rss源很赞,所以有必要写一下教程:

图片失效

没用过RSS的不知道它的好,但是喜欢的网站不支持RSS订阅怎么办?用feed43.com就可以了,把web页面转换成RSS feed。

转换成RSS可以方便的通过RSS订阅通知我一个原本不支持RSS的站点,更方便更快捷。

这里我以http://51argentina.com/?action-category-catid-102作为例子

注册feed43,收到邮件后验证一下,就可以享受免费的功能了。

登陆feed43.com ,选择Create your own feed进入

Step 1. Specify source page address (URL)
选择你想转换的Web页面地址,然后Reload后生成页面代码

Address: http://xxx51argentina.com/?action-category-catid-102
Encoding: gbk (有的网站没填的话会显示乱码,我采集的这个网站就是)

注意:在输入Address后点Reload按钮,如果下面的Page Source不显示乱码,那么Encoding不指定也可以。自己可以通过察看欲转换页面的源代码的开头处,<meta ... charset=gbk">

Step 2. Define extraction rules
定义模板规则,然后Extract后生成抓到的数据

Global Search Pattern: {%}
Item (repeatable) Search Pattern*:

<li><a href="{%}"{*}style="">{%}{*}</a>{*}
</li>

重点在于Search Pattern的填写,可以观察上面生成的页面代码找到规律,我们发现每一条标题的代码都是类似如下的。

<li><a href="http://www.51argentina.com/?action-viewnews-itemid-26614" style="">有轨电车曾是布市引以为傲的大众交通工具(图)</a>
<span class="smalltxt">(04-06 05:04)</span>
</li>

只要把内容部分用{%}替代即可。 Extract后生成的数据如下:

Item 1

{%1} = http://www.xxx51argentina.com/?action-viewnews-itemid-26614
{%2} = 有轨电车曾是布市引以为傲的大众交通工具(图)

Item 2

{%1} = http://www.xxx51argentina.com/?action-viewnews-itemid-22619
{%2} = 国会大选基本常识

Item 3

{%1} = http://www.xxx51argentina.com/?action-viewnews-itemid-23301
{%2} = 阿根廷文学:独立革命时期初现繁荣民族特点浓

...
我们可以看到模板中定义的{%}会自动换成{%1}{%2}

Step 3. Define output format
利用上面生成的{%1}{%2}...来定义输出的格式

RSS item properties
Item Title Template*:
{%2}
Item Link Template*: {%1}
Item Content Template*: 可以不填

这里我们把{%2}设定为标题,{%1}设定为链接,当然,你要更精确的话,也可以设置更多,比如{%3}设定为时间,{%4}设定为内容,点击Preview预览。

Step 4. Get your RSS feed
最后生成RSS Feed地址:http://feed43.com/0628716428257430.xml,然后就可以用各类RSS阅读器(例如GreatNews)订阅访问了。

最后对其进行处理,需要为注册用户:
Change file name of this feed to make it more user-friendly--修改RSS Feed的地址名称;
Change feed edit password [?]--设定密码
Make this feed private [?]--在个人栏目里显示 Feed43默认不需要注册即可制作feed并使用。

用这么多rss feed工具,感觉这个还是最强大的,比较灵活性,这个阿根廷华人网站用别的rss工具是无法获得rss源的,想要知道是什么网站,进入上面我做好的rss源链接。


分类:网络博客 标签:,,,

已经有20条评论!

 

Loading...
  1. 其实还是挺简单的,不过要用心的研究研究~

    沙发!
  2. a6gw6c那一次我看着你消失在人海

    板凳!
  3. 呵呵,这样麻烦啊。

    地板!
  4. 完全赞同~
    我之前也专门写文章分享过,参阅《分享:无Feed输出的网站RSS订阅妙招》
    http://yeahcao.blog.hexun.com/26901086_d.html

    4F
  5. 复杂呢~

    5F
  6. 这个……我现在很少看订阅了

    6F
    • 我以前也很少用rss阅读,手机里安装了google阅读,总是提醒一大堆,都没去看,到现在还是不喜欢在rss里面看,因为不能留言,我看完喜欢留言的。这次订阅完全是为了看那些新闻,那些新闻对我来说很有价值,毕竟在国外生活,本来就都是外文,头大,难得有华人做的网站,并且新闻都是翻译好了的,所以第一次感觉对这个信息的需求,可惜居然不让订阅,郁闷死了。所以才千方百计的想订阅,有时候车上看。

    • 有需求慢慢折腾。

    • 嗯,现在已经能成功的订阅全文了,还是利用了2个工具才实行,不容易啊。

  7. 确实少看订阅的内容了,现在连电脑都懒得去玩更新也少了..
    只是有空就上来看..

    7F
    • 有点和我一样,以前疯狂的玩过,现在已经过渡期已经过了,开始厌了,哈哈。我一般看看电影听听音乐,写博客,没其他事情了。

  8. 这个工具确实很强大啊

    8F
  9. 那个,问下现在订阅无RSS源的方法工具有更好的了吗?

    9F
  10. han

    那你现在在用哪个工具?还是fivefilters.org 吗?

    10F
  11. 您好!您的这篇文章很好。您能推荐一个有此能力的网站设计公司吗?

    11F

怎么样?你也说一句吧!

gravatar

汗 色 悲 闭嘴 调皮 笑 惊 亲 雷 馋 晕 酷 奸 怒 狂 萌 吃 贪 囧 羞 哭