您的位置:首页 > 房产 > 家装 > dw网页设计步骤_开发小程序大概多少钱_网站seo什么意思_短网址

dw网页设计步骤_开发小程序大概多少钱_网站seo什么意思_短网址

2024/10/6 2:20:06 来源:https://blog.csdn.net/xun527/article/details/142335481  浏览:    关键词:dw网页设计步骤_开发小程序大概多少钱_网站seo什么意思_短网址
dw网页设计步骤_开发小程序大概多少钱_网站seo什么意思_短网址

一、库安装

pip install cpca

注意:目前 cpca 模块仅支持Python3及以上版本。

二、基本使用

通过两行代码就能实现最基本的省市区提取:

import cpcalocation_str = ["新疆古阿贾克斯就打开房间啊开始","河北省石家庄市动物园","安全生产目标为“五无”:无死亡、无重伤、无倒(坍)塌、无中毒、无火灾。争创天津市市级文明工地。","武清区广贤路与广聚路交叉口北200米","共和人民政府"
]
df = cpca.transform(location_str)
print(df)

效果如下:

          省     市     区               地址  adcode
0  新疆维吾尔自治区  None  None    古阿贾克斯就打开房间啊开始  650000
1       河北省  石家庄市  None              动物园  130100
2       天津市  None  None          市级文明工地。  120000
3       天津市   市辖区   武清区  广贤路与广聚路交叉口北200米  120114
4      None  None  None             None    None

如果你想获知程序是从字符串的那个位置提取出省市区名的,可以添加一个 pos_sensitive=True 参数:

import cpcalocation_str = ["新疆古阿贾克斯就打开房间啊开始","河北省石家庄市动物园","安全生产目标为“五无”:无死亡、无重伤、无倒(坍)塌、无中毒、无火灾。争创天津市市级文明工地。","武清区广贤路与广聚路交叉口北200米","共和人民政府"
]
df = cpca.transform(location_str, pos_sensitive=True)
print(df)

效果如下:

          省     市     区               地址  adcode  省_pos  市_pos  区_pos
0  新疆维吾尔自治区  None  None    古阿贾克斯就打开房间啊开始  650000      0     -1     -1
1       河北省  石家庄市  None              动物园  130100      0      3     -1
2       天津市  None  None          市级文明工地。  120000     37     -1     -1
3       天津市   市辖区   武清区  广贤路与广聚路交叉口北200米  120114     -1     -1      0
4      None  None  None             None    None     -1     -1     -1

三、高级使用

从大段文本中批量识别多个地区:

import cpcalocation_str = "太原是一座具有2500年建城史的历史文化名城。"\"行走锦绣太原城,每一条沧桑厚重的街巷都充满了历史气息,"\"每一块古色古香的砖瓦都承载了文化符号,"\"每一段鲜为人知的背后都记载了人文故事。"
df = cpca.transform_text_with_addrs(location_str, pos_sensitive=True)
print(df)

效果如下:

     省    市     区 地址  adcode  省_pos  市_pos  区_pos
0  山西省  太原市  None     140100     -1     27     -1

四、更多内容

更多的细节你可以访问这个项目的Github主页阅读,该项目的README完全中文编写,非常容易阅读:

https://github.com/DQinYuan/chinese_province_city_area_mapper

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com