本文共 504 字,大约阅读时间需要 1 分钟。
今天在linux下工作了一上午,终于把网络爬虫larbin配好了. 开始下了一个larbin1.2.2,用了半天不好使,感觉这个程序的结构和之前接触的也不太一样.又去google搜了下,下了个2.6.2的版本.改了之后就好用了. 配置的具体方法为: 1.先cd到larbin所在的文件目录下. 2.将optional.h的对应项修改好,特别是output这一项,原来默认的是没有输出,一定要改过来,不然就白爬了. 注意:一定要在编译之前将optional.h里的东西改好.而larbin.conf文件里的东西可以之后再改.因为larbin.conf是配置文件,是在运行时去动态读的,而optional.h里的东西编译时是要将其加入到代码里去的! 3. ./configure gmake 4.此时出现了一个小的编译错误,根据编译错误的提示,将相应行的默认参数去掉就可以了. 5.修改larbin.conf文件. 这样,就配置编译好了.直接./larbin就可以了. 下一步就是加入自己的代码对下下来的网页进行处理,提取里面的信息进行处理了.这个就要阅读源代码了. 感觉linux用的还是满不错的.以后得多用用转载地址:http://dtyub.baihongyu.com/