推广 热搜: 行业  机械  设备    经纪  教师  系统  参数    蒸汽 

pandas关键字提取_pandas处理文本关键词命中

   日期:2024-11-05     移动:http://yishengsujiao.xhstdz.com/quote/389.html

使用pandas中的apply提取关键词

pandas关键字提取_pandas处理文本关键词命中

从description字段中查看命中了哪些关键词并形成新的一列

用第二列匹配出第三列

代码如下

import re

import pandas as pd

#导入路径

from setting import DataPath

from os import path

def mingzhong(das):

keywords = ['关键词1','关键词2','关键词3'....]

key_box = []

for keyword in keywords:

pattern = re.compile('.*' + keyword + '.*')

if pattern.match(das["description"]) is not None:

key_box.append(keyword)

print(key_box)

return key_box

df1 = pd.read_excel(path.join(DataPath, '欲处理的文件.xlsx'),sheet_name="sheet页的名字",usecols='L,AL')

df1["命中关键词"]=df1.apply(mingzhong,axis=1)

writer = pd.ExcelWriter(path.join(DataPath,'命中.xlsx'))

df1.to_excel(writer, sheet_name='sheet1', index=False)

本文地址:http://nhjcxspj.xhstdz.com/quote/389.html    物流园资讯网 http://nhjcxspj.xhstdz.com/ , 查看更多

特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


0相关评论
相关行业动态
推荐行业动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号