美文网首页大数据 爬虫Python AI Sql
使用python正则把markdown转换成文本

使用python正则把markdown转换成文本

作者: 海上牧云l | 来源:发表于2017-03-26 22:13 被阅读258次

在我的个人博客中,使用的markdown编辑器,首页中显示的摘要是直接截取了内容的前150个字符。但是会截取到#*`等这些markdown符号,在首页用markdown展示又会影响布局,所以采用替换的方式,让其转换成文本。

    #去掉p标签和单引号
    content_text1 = content.replace('<p>', '').replace('</p>', '').replace(''', '')
    # 去掉图片链接
    content_text2 = re.sub('!\[\]\((.*?)\)', '', content_text1)
    # 去掉markdown标签
    pattern = '[\\\`\*\_\[\]\#\+\-\!\>]'
    content_text3 = re.sub(pattern, '', content_text2)
    #取前150字符作为文章摘要
    article_info.abstract = content_text3[:150]

效果基本达到了,这是前后对比,弊端还是有的,但也没找到更好的方法了

之前

之后

相关文章

  • 使用python正则把markdown转换成文本

    在我的个人博客中,使用的markdown编辑器,首页中显示的摘要是直接截取了内容的前150个字符。但是会截取到#*...

  • highlight.js 为博客增加代码着色

    利用:marked 把 markdown 文本转换成 HTML。利用:highlight.js 为代码添加相应 c...

  • 简书Markdown语法

    欢迎使用简书Markdown编辑器 Markdown是一种简单的文本格式语言, 以简单的键盘字符编写文档,转换成h...

  • Pandoc docx to markdown

    介绍 本篇文档介绍如何将docx文档转换成markdown,并会介绍与python如何结合使用Pandoc的过滤 ...

  • Kaggle比赛:Text Normalization for

    问题描述 所谓“文本正则”,即将手写形式的文本转换成语音形式的文本。 例子: 手写:A baby giraffe ...

  • 简书设置Markdown及其语法大全

    1.简书中如何设置使用Markdown? 设置中把富文本改为Markdown即可。 2.简书中的Markdown支...

  • re正则表达式——python

    使用形式化模式搜索和修改文本。python中正则表达式通过re模块使用语法以per语言语法为基础。 查找文本中的模...

  • Python 文本转语音

    文本转语音,一般会用在无障碍开发。下面介绍如何使用Python实现将文本文件转换成语音输出。 [toc] 准备 我...

  • pandoc markdown 转word 带图片连接

    错误描述 之前已经有详细记录,python通过pypandoc,如何把markdown格式的文本,或者md扩展名文...

  • Markdown使用介绍

    Markdown 是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档,然后转换成有效的XHTML(或...

网友评论

    本文标题:使用python正则把markdown转换成文本

    本文链接:https://www.haomeiwen.com/subject/tkxlottx.html