美文网首页Linux
提取文本中的信息

提取文本中的信息

作者: cf6d95617c55 | 来源:发表于2018-03-17 10:35 被阅读0次

目前有一个需求需要完成,实现一个 Bash 脚本/home/shiyanlou/getimage.sh,从给定一个 Markdown 文档中提取所有的图片链接。

可义从下面的链接地址下载测试文档:

$ cd /home/shiyanlou$ wgethttp://labfile.oss.aliyuncs.com/contesth1/shiyanlou_lab1.md

实验文档中包含图片的行一般格式为:

![实验操作界面](https://dn-anything-about-doc.qbox.me/document-uid13labid292timestamp1467702955677.png/wm)

我们需要提取的链接地址为:

https://dn-anything-about-doc.qbox.me/document-uid13labid292timestamp1467702955677.png

脚本执行过程及输出范例如下:

$ cd /home/shiyanlou$ ./getimage.sh shiyanlou_lab1.md

https://dn-anything-about-doc.qbox.me/document-uid13labid292timestamp1467722221121.png

https://dn-anything-about-doc.qbox.me/document-uid13labid292timestamp1467231123451.png

https://dn-anything-about-doc.qbox.me/document-uid13labid292timestamp1467702955677.png...

cat getimage.sh

#!/bin/bash

grep '^\!' $1 | awk -F "(" '{print $2}'| sed 's/\/wm)//g'| sed 's/)//g'

相关文章

  • 提取文本中的信息

    目前有一个需求需要完成,实现一个 Bash 脚本/home/shiyanlou/getimage.sh,从给定一个...

  • LDA

    主题模型用于提取文本信息中的主题。是无监督学习方法。主题模型主要用于文本聚类,用于对非结构化的本文提取信息和特征。...

  • 阅读能力五维度

    阅读能力的五个维度是: 一、提取信息,从文本中获取多元信息的能力。 二、整体感知,形成对文本内容整体感知...

  • 阅读能力五维度

    阅读能力的五个维度是: 一、提取信息,从文本中获取多元信息的能力。 二、整体感知,形成对文本内容整体感知...

  • 提取 genecode的gtf注释信息

    读入数据 提取gene信息 获取想要的信息 写在最后的话 很多大神用perl和python来提取,对于文本提取这两...

  • 张贵栓‖小学语文六年级阅读创意运用能力策略

    阅读能力的五个维度是:一、提取信息,从文本中获取多元信息的能力。二、整体感知,形成对文本内容整体感知,初步概括的能...

  • python爬虫3:beautifulsoupp实践

    当用text提取纯文本时,获取标签内所有纯文本信息 父标签只能提取自身的属性值,不能提取子标签的属性值 写循环,存...

  • python+gephi构建文本知识图谱

    构建文本知识图谱主要分为3部分,首先对文本中的关键词进行提取,其次是根据提取信息构建关键词之间的共现矩阵,最后通过...

  • 提取PDF文本信息:入门

    本文作者:王碧琪文字编辑:钱梦璇技术总编:张 邯 PDF格式的文件经常出现在我们的办公生活中,它更像是一张图片,...

  • 快速提取有效信息文本

    今天的数据分列最后一个Power Query 拆分没用过,还得练习一下 快速提取有效信息文本:数据—分列 一、基本...

网友评论

    本文标题:提取文本中的信息

    本文链接:https://www.haomeiwen.com/subject/ezndqftx.html