Beautiful Soup是一款非常强大的HTML/XML解析软件。软件中提供了部分简单的方法和Python术语,用于检索和修改语法树:一个用于解析文档并提取相关信息的工具包。让用户能够更加灵活的抓取网站数据,大大提高了工作的效率。有需要的小伙伴快来下载吧!
软件特色
1.Beautiful Soup最新版提供了一些简单的方法和Python术语,用于检索和修改语法树:一个用于解析文档并提取相关信息的工具包。这样你写一个应用不需要写很多代码。
2.Beautiful Soup自动将输入文档转换为Unicode编码,并将输出文档转化为UTF-8编码。你不需要考虑编码,除非输入文档没有指出其编码并且Beautiful Soup无法自动检测到,这时你需要指出原来的编码方式。
3.Beautiful Soup位于一些流行的Python解析器比如lxml和html5lib的上层,这允许你使用不同的解析策略或者牺牲速度来换取灵活性。
使用方法
1、解压Beautiful Soup最新版文件
将下载得到的压缩包解压到任意文件夹,路径不含中文
2、打开cmd命令提示符
win+r,输入cmd,回车
进入解压后的目录,我这里是C:Python27bs4beautifulsoup4-4.3.2
所以使用
cd C:Python27bs4beautifulsoup4-4.3.2
然后
setup.py build
接着
setup.py install
完成安装
3、测试
python
import bs4
没有提示错误,成功!
常见问题
如何遍历树?
使用find_all 函数
复制代码 代码如下:
find_all(name, attrs, recursive, text, limit, **kwargs)
举例说明:
代码如下:
print soup.find_all('title')
print soup.find_all('p','title')
print soup.find_all('a')
print soup.find_all(id="link2")
print soup.find_all(id=True)
返回值为:
标签: 编程工具
精品推荐
-
IntelliJ IDEA 2019
详情 -
Microsoft VC++6.0安装包
详情 -
Microsoft VC++2015版运行库
详情 -
VC++2019运行库
详情 -
RobotStudio
详情 -
Intel Visual Fortran
详情 -
Microsoft Visual Studio 2022
详情 -
Microsoft VC++2010运行库安装包
详情 -
源码编辑器4.0
详情 -
博途V18破解授权软件
详情 -
GX Works2
详情 -
microsoft visual studio 2019免费版
详情 -
hypermill2021超级加密狗破解版
详情 -
西门子博途v17破解版
详情 -
星三好图形化编程软件官方最新版
详情 -
VBSEdit9
详情
-
6 源码智造编辑器
装机必备软件
网友评论