l 是python的一个解析库,支持HTML和 的解析,支持XPath解析方式,而且解析效率非常高

XPath,全称 Path Language,即 路径语言,它是一门在 文档中查找信息的语言,它最初是用来搜寻 文档的,但是它同样适用于HTML文档的搜索

XPath的选择功能十分强大,它提供了非常简明的路径选择表达式,另外,它还提供了超过100个内建函数,用于字符串、数值、时间的匹配以及节点、序列的处理等,几乎所有我们想要定位的节点,都可以用XPath来选择

XPath于1999年11月16日成为W3C标准,它被设计为供XSLT、XPointer以及其他 解析软件使用,更多的文档可以访问其官方网站:https://www.w3.org/TR/xpath/

windows系统下的安装:

#pip安装
pip3 install l 

#wheel安装
#下载对应系统版本的wheel文件:http://www.lfd.uci.edu/~gohlke/pythonlibs/#l 
pip3 install l -4.2.1-cp36-cp36m-win_amd64.whl

linux下安装:

yum install -y epel-release libxslt-devel lib 2-devel openssl-devel

pip3 install l 

验证安装:

$python3
>>>import l 

收藏 打印