写点什么

Python 进阶 (十九)Python3 安装第三方爬虫库 BeautifulSoup4

  • 2022-10-14
    江苏
  • 本文字数:1723 字

    阅读完需:约 6 分钟

Python进阶(十九)Python3安装第三方爬虫库BeautifulSoup4

一、前言

在做 Python3 爬虫练习时,从网上找到了一段代码如下:


#使用第三方库BeautifulSoup,用于从html或xml中提取数据from bs4 import BeautifulSoup
复制代码


自己实践后,发现出现了错误,如下所示:



以上错误提示是说没有发现名为“bs4”的模块。即“bs4”模块未安装。进入 Python 安装目录,以作者 IDE 为例,




控制台提示第三方库 BeautifulSoup4 安装成功!回到之前的程序中,会发现 IntelJ 已经检测到第三方库 BS4 的安装,已自更新项目,此时项目恢复正常,无错误提示。

二、常见问题

在做 BS4 爬虫练习时,新建的文件名为 bs4.py,结果出现如下错误提示:



即 ImportError: cannot import name BeautifulSoup 一般有一下几种情况:


  1. python2.x下安装的BeautifulSouppython3.x下运行会报这种错,可用pip3 install Beautifulsoup4

  2. 导入时指定 bs4 像这样: from bs4 import BeautifulSoup

  3. 太巧合,如果你测试的文件名正好命名为 bs4.py,那怎么整都会报这个错,把名字改成其他的吧。

三、拓展阅读


四、延伸阅读 Python 字符串操作

4.1 去空格及特殊符号

s.strip().lstrip().rstrip(',')
复制代码

4.2 复制字符串

#strcpy(sStr1,sStr2)sStr1 = 'strcpy'sStr2 = sStr1sStr1 = 'strcpy2'print sStr2
复制代码

4.3 连接字符串

#strcat(sStr1,sStr2)sStr1 = 'strcat'sStr2 = 'append'sStr1 += sStr2print sStr1
复制代码

4.4 查找字符

#strchr(sStr1,sStr2)# < 0 为未找到sStr1 = 'strchr'sStr2 = 's'nPos = sStr1.index(sStr2)print nPos
复制代码

4.5 比较字符串

#strcmp(sStr1,sStr2)sStr1 = 'strchr'sStr2 = 'strch'print cmp(sStr1,sStr2)
复制代码

4.6 扫描字符串是否包含指定的字符

#strspn(sStr1,sStr2)sStr1 = '12345678'sStr2 = '456'#sStr1 and chars both in sStr1 and sStr2print len(sStr1 and sStr2)
复制代码

4.7 字符串长度

#strlen(sStr1)sStr1 = 'strlen'print len(sStr1)
复制代码

4.8 将字符串中的大小写转换

#strlwr(sStr1)sStr1 = 'JCstrlwr'sStr1 = sStr1.upper()#sStr1 = sStr1.lower()print sStr1
复制代码

4.9 追加指定长度的字符串

#strncat(sStr1,sStr2,n)sStr1 = '12345'sStr2 = 'abcdef'n = 3sStr1 += sStr2[0:n]print sStr1
复制代码

4.10 字符串指定长度比较

#strncmp(sStr1,sStr2,n)sStr1 = '12345'sStr2 = '123bc'n = 3print cmp(sStr1[0:n],sStr2[0:n])
复制代码

4.11 复制指定长度的字符

#strncpy(sStr1,sStr2,n)sStr1 = ''sStr2 = '12345'n = 3sStr1 = sStr2[0:n]print sStr1
复制代码

4.12 将字符串前 n 个字符替换为指定的字符

#strnset(sStr1,ch,n)sStr1 = '12345'ch = 'r'n = 3sStr1 = n * ch + sStr1[3:]print sStr1
复制代码

4.13 扫描字符串

#strpbrk(sStr1,sStr2)sStr1 = 'cekjgdklab'sStr2 = 'gka'nPos = -1for c in sStr1:    if c in sStr2:        nPos = sStr1.index(c)        breakprint nPos
复制代码

4.14 翻转字符串

#strrev(sStr1)sStr1 = 'abcdefg'sStr1 = sStr1[::-1]print sStr1
复制代码

4.15 查找字符串

#strstr(sStr1,sStr2)sStr1 = 'abcdefg'sStr2 = 'cde'print sStr1.find(sStr2)
复制代码

4.16 分割字符串

#strtok(sStr1,sStr2)sStr1 = 'ab,cde,fgh,ijk'sStr2 = ','sStr1 = sStr1[sStr1.find(sStr2) + 1:]print sStr1#或者s = 'ab,cde,fgh,ijk'print(s.split(','))
复制代码

4.17 连接字符串

delimiter = ','mylist = ['Brazil', 'Russia', 'India', 'China']print delimiter.join(mylist)
复制代码

4.18 截取字符串

str = ’0123456789′print str[0:3] #截取第一位到第三位的字符print str[:] #截取字符串的全部字符print str[6:] #截取第七个字符到结尾print str[:-3] #截取从头开始到倒数第三个字符之前print str[2] #截取第三个字符print str[-1] #截取倒数第一个字符print str[::-1] #创造一个与原字符串顺序相反的字符串print str[-3:-1] #截取倒数第三位与倒数第一位之前的字符print str[-3:] #截取倒数第三位到结尾print str[:-5:-3] #逆序截取,具体啥意思没搞明白?
复制代码

4.19 python 字符串跟整型互转

print ("整型:",int(50))a=int(50)print("整型:",type(a))numStr = "50";print ("字符串:",type(numStr))convertedInt = int(numStr);print("字符串转换为整型:",convertedInt)convertedstr=str(a)print("整型转换为字符串:",convertedInt)
复制代码



发布于: 刚刚阅读数: 3
用户头像

No Silver Bullet 2021-07-09 加入

岂曰无衣 与子同袍

评论

发布
暂无评论
Python进阶(十九)Python3安装第三方爬虫库BeautifulSoup4_Python_No Silver Bullet_InfoQ写作社区