在做html解析时,遇到了需要将html的<table> 标签转成需要的形式。
这里是转成 (' 增持方式 ', ' 竞价交易 ') 这种形式。
接下来的代码是可以处理可变长的table,思路很简单,可以根据自己的需求封装成函数,或者修改。
from bs4 import BeautifulSoup
html = """
目标html的只包含表格的文本
"""
soup = BeautifulSoup(html, 'lxml')
data_list = []
namelist=[]
for idx, tr in enumerate(soup.find_all('tr')):
if idx != 0:
tds = tr.find_all('td')
values=[w.text for w in tds]
# print(list(values))
ans=zip(namelist,values)
data_list.append(ans)
else:
templist=(tr.find_all("td"))
namelist=[w.text for w in templist]
# print(namelist)
for data in data_list:
print(list(data))
最后
以上就是饱满小伙最近收集整理的关于python html表格 转化的全部内容,更多相关python内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复