博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
larbin 2.6.2 配置方法
阅读量:2190 次
发布时间:2019-05-02

本文共 504 字,大约阅读时间需要 1 分钟。

    今天在linux下工作了一上午,终于把网络爬虫larbin配好了.
    开始下了一个larbin1.2.2,用了半天不好使,感觉这个程序的结构和之前接触的也不太一样.又去google搜了下,下了个2.6.2的版本.改了之后就好用了.
    配置的具体方法为:
    1.先cd到larbin所在的文件目录下.
    2.将optional.h的对应项修改好,特别是output这一项,原来默认的是没有输出,一定要改过来,不然就白爬了.
    注意:一定要在编译之前将optional.h里的东西改好.而larbin.conf文件里的东西可以之后再改.因为larbin.conf是配置文件,是在运行时去动态读的,而optional.h里的东西编译时是要将其加入到代码里去的!
    3.   ./configure
    gmake
    4.此时出现了一个小的编译错误,根据编译错误的提示,将相应行的默认参数去掉就可以了.
    5.修改larbin.conf文件.
    这样,就配置编译好了.直接./larbin就可以了.
    下一步就是加入自己的代码对下下来的网页进行处理,提取里面的信息进行处理了.这个就要阅读源代码了.
    感觉linux用的还是满不错的.以后得多用用

转载地址:http://dtyub.baihongyu.com/

你可能感兴趣的文章
浅谈 GBDT
查看>>
如何选择优化器 optimizer
查看>>
一文了解强化学习
查看>>
CART 分类与回归树
查看>>
seq2seq 的 keras 实现
查看>>
seq2seq 入门
查看>>
什么是 Dropout
查看>>
用 LSTM 做时间序列预测的一个小例子
查看>>
用 LSTM 来做一个分类小问题
查看>>
详解 LSTM
查看>>
按时间轴简述九大卷积神经网络
查看>>
详解循环神经网络(Recurrent Neural Network)
查看>>
为什么要用交叉验证
查看>>
用学习曲线 learning curve 来判别过拟合问题
查看>>
用验证曲线 validation curve 选择超参数
查看>>
用 Grid Search 对 SVM 进行调参
查看>>
用 Pipeline 将训练集参数重复应用到测试集
查看>>
PCA 的数学原理和可视化效果
查看>>
机器学习中常用评估指标汇总
查看>>
什么是 ROC AUC
查看>>