一、前言
在做 Python3 爬虫练习时,从网上找到了一段代码如下:
#使用第三方库BeautifulSoup,用于从html或xml中提取数据from bs4 import BeautifulSoup
复制代码
自己实践后,发现出现了错误,如下所示:
以上错误提示是说没有发现名为“bs4”的模块。即“bs4”模块未安装。进入 Python 安装目录,以作者 IDE 为例,
控制台提示第三方库 BeautifulSoup4 安装成功!回到之前的程序中,会发现 IntelJ 已经检测到第三方库 BS4 的安装,已自更新项目,此时项目恢复正常,无错误提示。
二、常见问题
在做 BS4 爬虫练习时,新建的文件名为 bs4.py,结果出现如下错误提示:
即 ImportError: cannot import name BeautifulSoup 一般有一下几种情况:
在python2.x下安装的BeautifulSoup在python3.x下运行会报这种错,可用pip3 install Beautifulsoup4 。
导入时指定 bs4 像这样: from bs4 import BeautifulSoup。
太巧合,如果你测试的文件名正好命名为 bs4.py,那怎么整都会报这个错,把名字改成其他的吧。
三、拓展阅读
四、延伸阅读 Python 字符串操作
4.1 去空格及特殊符号
s.strip().lstrip().rstrip(',')
复制代码
4.2 复制字符串
#strcpy(sStr1,sStr2)sStr1 = 'strcpy'sStr2 = sStr1sStr1 = 'strcpy2'print sStr2
复制代码
4.3 连接字符串
#strcat(sStr1,sStr2)sStr1 = 'strcat'sStr2 = 'append'sStr1 += sStr2print sStr1
复制代码
4.4 查找字符
#strchr(sStr1,sStr2)# < 0 为未找到sStr1 = 'strchr'sStr2 = 's'nPos = sStr1.index(sStr2)print nPos
复制代码
4.5 比较字符串
#strcmp(sStr1,sStr2)sStr1 = 'strchr'sStr2 = 'strch'print cmp(sStr1,sStr2)
复制代码
4.6 扫描字符串是否包含指定的字符
#strspn(sStr1,sStr2)sStr1 = '12345678'sStr2 = '456'#sStr1 and chars both in sStr1 and sStr2print len(sStr1 and sStr2)
复制代码
4.7 字符串长度
#strlen(sStr1)sStr1 = 'strlen'print len(sStr1)
复制代码
4.8 将字符串中的大小写转换
#strlwr(sStr1)sStr1 = 'JCstrlwr'sStr1 = sStr1.upper()#sStr1 = sStr1.lower()print sStr1
复制代码
4.9 追加指定长度的字符串
#strncat(sStr1,sStr2,n)sStr1 = '12345'sStr2 = 'abcdef'n = 3sStr1 += sStr2[0:n]print sStr1
复制代码
4.10 字符串指定长度比较
#strncmp(sStr1,sStr2,n)sStr1 = '12345'sStr2 = '123bc'n = 3print cmp(sStr1[0:n],sStr2[0:n])
复制代码
4.11 复制指定长度的字符
#strncpy(sStr1,sStr2,n)sStr1 = ''sStr2 = '12345'n = 3sStr1 = sStr2[0:n]print sStr1
复制代码
4.12 将字符串前 n 个字符替换为指定的字符
#strnset(sStr1,ch,n)sStr1 = '12345'ch = 'r'n = 3sStr1 = n * ch + sStr1[3:]print sStr1
复制代码
4.13 扫描字符串
#strpbrk(sStr1,sStr2)sStr1 = 'cekjgdklab'sStr2 = 'gka'nPos = -1for c in sStr1: if c in sStr2: nPos = sStr1.index(c) breakprint nPos
复制代码
4.14 翻转字符串
#strrev(sStr1)sStr1 = 'abcdefg'sStr1 = sStr1[::-1]print sStr1
复制代码
4.15 查找字符串
#strstr(sStr1,sStr2)sStr1 = 'abcdefg'sStr2 = 'cde'print sStr1.find(sStr2)
复制代码
4.16 分割字符串
#strtok(sStr1,sStr2)sStr1 = 'ab,cde,fgh,ijk'sStr2 = ','sStr1 = sStr1[sStr1.find(sStr2) + 1:]print sStr1#或者s = 'ab,cde,fgh,ijk'print(s.split(','))
复制代码
4.17 连接字符串
delimiter = ','mylist = ['Brazil', 'Russia', 'India', 'China']print delimiter.join(mylist)
复制代码
4.18 截取字符串
str = ’0123456789′print str[0:3] #截取第一位到第三位的字符print str[:] #截取字符串的全部字符print str[6:] #截取第七个字符到结尾print str[:-3] #截取从头开始到倒数第三个字符之前print str[2] #截取第三个字符print str[-1] #截取倒数第一个字符print str[::-1] #创造一个与原字符串顺序相反的字符串print str[-3:-1] #截取倒数第三位与倒数第一位之前的字符print str[-3:] #截取倒数第三位到结尾print str[:-5:-3] #逆序截取,具体啥意思没搞明白?
复制代码
4.19 python 字符串跟整型互转
print ("整型:",int(50))a=int(50)print("整型:",type(a))numStr = "50";print ("字符串:",type(numStr))convertedInt = int(numStr);print("字符串转换为整型:",convertedInt)convertedstr=str(a)print("整型转换为字符串:",convertedInt)
复制代码
评论