Ruby解析HTML
Ruby解析HTML(或XML)可以使用nokogiri。我的应用里需要查找HTML页面里的某个元素,结果发现实现方式非常简单,就像使用jquery一样。例如我要获取到octopress博客文章里的文章内容、文章标题、文章分类,就像这篇博客:
最关键就是doc.css('div.entry-content')
。想起以前用lisp写的那个版本,还手工遍历了整个HTML页面,实在太落后了。上面这个函数的作用就是取得一篇博文的HTML页面,然后返回该博文的内容、标题和分类。
Ruby调用xml-rpc
可以使用rails-xmlrpc
这个库,直接使用gem安装:gem install rails-xmlrpc
。这个库分为客户端和服务器两部分,我的应用是使用metaweblog API:
Ruby读取yaml
就像Rails里那些配置文件一样,都属于yaml配置文件。我的应用里只需使用简单的key-value形式的yaml配置,就像:
解析的时候需要使用yaml
库:
针对以上配置,YAML::load
得到的结果就是一个hash表:
以上,我写了一个小工具,可以让我每次在codemacro.com发表博客后,使用这个工具自动解析生成的文章,然后发表到CPPBLOG上。完整源码可在这个上:https://gist.github.com/3301662