来源:蜘蛛抓取(WebSpider)
时间:2017-10-27 17:52
标签:
东海x4和x5
在 SegmentFault,解决技术问题
每个月,我们帮助 1000 万的开发者解决各种各样的技术问题。并助力他们在技术能力、职业生涯、影响力上获得提升。
一线的工程师、著名开源项目的作者们,都在这里:
获取验证码
已有账号?
问题对人有帮助,内容完整,我也想知道答案
问题没有实际价值,缺少关键内容,没有改进余地
&dt&学科主题:&/dt&
&dd&&a href="openlink.php?keyword=%E9%95%BF%E7%AF%87%E5%B0%8F%E8%AF%B4"&长篇小说&/a&-中V-当代&/dd&
&dl class="booklist"&
&dt&中图法分类号:&/dt&
&dd&&a href="openlink.php?coden=I247.5"&I247.5&/a&&/dd&
&dl class="booklist"&
&dt&提要文摘附注:&/dt&
&dd&小说中的主公,正是因为当年盗墓的爷爷赘杭而在杭,开了一家小的古董”子,守护着那群长沙土夫子古墓不知名怪物捭中b命抢Q的战V帛书……&/dd&
如何解决?
答案对人有帮助,有参考价值
答案没帮助,是错误的答案,答非所问
# tested under python3.4
def convert(s):
s = s.strip('&#x;') # 把'长'变成'957f'
s = bytes(r'\u' + s, 'ascii') # 把'957f'转换成b'\\u957f'
return s.decode('unicode_escape') # 调用bytes对象的decode,encoding用unicode_escape,把b'\\u957f'从unicode转义编码解码成unicode的'长'。具体参见codecs的文档
print(convert('长')) # =& '长'
print(re.sub(r'&#x....;',
lambda match: convert(match.group()),
全文替换后的结果:
&dt&学科主题:&/dt&
&dd&&a href="openlink.php?keyword=%E9%95%BF%E7%AF%87%E5%B0%8F%E8%AF%B4"&长篇小说&/a&-中国-当代&/dd&
&dl class="booklist"&
&dt&中图法分类号:&/dt&
&dd&&a href="openlink.php?coden=I247.5"&I247.5&/a&&/dd&
&dl class="booklist"&
&dt&提要文摘附注:&/dt&
&dd&小说中的主人公,正是因为当年盗墓的爷爷人赘杭州而身在杭州,开了一家小的古董铺子,守护着那群长沙土夫子从古墓不知名怪物捭中拼命抢出的战国帛书……&/dd&
# for python2.7
def convert(s):
return ''.join([r'\u', s.strip('&#x;')]).decode('unicode_escape')
ss = unicode(ss, 'gbk') # convert gbk-encoded byte-string ss to unicode string
print re.sub(r'&#x....;', lambda match: convert(match.group()), ss)
答案对人有帮助,有参考价值
答案没帮助,是错误的答案,答非所问
这个是 charref, HTML 的解析库都可以处理好, 不需要手工处理.
Python 标准库有 HTMLParser (html.parser in Python 3)
第三方库推荐
同步到新浪微博
分享到微博?
关闭理由:
删除理由:
忽略理由:
推广(招聘、广告、SEO 等)方面的内容
与已有问题重复(请编辑该提问指向已有相同问题)
答非所问,不符合答题要求
宜作评论而非答案
带有人身攻击、辱骂、仇恨等违反条款的内容
无法获得确切结果的问题
非开发直接相关的问题
非技术提问的讨论型问题
其他原因(请补充说明)
我要该,理由是:print(re.sub(r'&#x....;',
lambda match: convert(match.group()),
全文替换后的结果:
这个是&charref, HTML 的解析库都可以处理好, 不需要手工处理.Python 标准库有&HTMLParser&(html.parser&in Python 3)第三方库推荐&
阅读(...) 评论() &世博V新„大Qy车候客点_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
世博V新„大Qy车候客点
大小:117.92KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢