XML模板及注意事项
@(我的第一个笔记本)[科普中国, XML帮助文档]
[TOC]
一、 什么是XML?
XML 被设计用来传输和存储数据,被设计用来传输和存储数据,其焦点是数据的内容。
HTML 被设计用来显示数据,其焦点是数据的外观。
XML特点概述:
- XML 指可扩展标记语言(EXtensible Markup Language)
- XML 是一种标记语言,很类似 HTML
- XML 的设计宗旨是传输数据,而非显示数据
- XML 标签没有被预定义。您需要自行定义标签。
- XML 被设计为具有自我描述性。
- XML 是 W3C 的推荐标准
二、XML代码格式(简洁版)
- 请查看:带注释详细说明版请点击这里
- 请下载: 科普信息化建设信息数据技术标准(暂行).doc
<?xml version="1.0"encoding="UTF-8"?>
<data>
<interface_version>1.0</interface_version>
<partner>xinhuanet</partner>
<lastmod>2015-07-02</lastmod>
<frequent>5</frequent>
<resources>
<!--文章资源示例-->
<resource>
<resource_id>10001</resource_id>
<resource_type>article</resource_type>
<action>add</action>
<title><![CDATA[标题]]]></title>
<author><![CDATA[作者]]]></author>
<source>新华网</source>
<keyword><![CDATA[北京,雾霾]]]></keyword>
<category>新闻</category>
<release_date>2015-07-26 15:24:50</release_date>
<description><![CDATA[摘要]]]></description>
<guide_image><![CDATA[http://x.cn/a.jpg]]]></guide_image>
<original_url><![CDATA[http://x.cn/xxx.shtml]]]></original_url>
<content><![CDATA[正文]]]></content>
<extends>
<info name="info_name1">value1</info>
<info name="info_name2">value2</info>
</extends>
</resource>
<!--视频资源示例-->
<resource>
<resource_id>10002</resource_id>
<resource_type>video</resource_type>
<action>add</action>
<title><![CDATA[标题]]]></title>
<format>flv</format>
<author><![CDATA[作者]]]></author>
<source>新华网</source>
<keyword><![CDATA[北京,雾霾]]]></keyword>
<category>新闻</category>
<release_date>2015-07-26 15:24:50</release_date>
<description><![CDATA[摘要]]]></description>
<guide_image><![CDATA[http://x.cn/a.jpg]]]></guide_image>
<original_url><![CDATA[http://x.cn/xxx.shtml]]]></original_url>
<video_file><![CDATA[http://x.cn/123.flv]]]></video_file>
<duration>00:00</duration>
<extends>
<info name="info_name1">value1</info>
<info name="info_name2">value2</info>
</extends>
</resource>
<!--图集资源示例-->
<resource>
<resource_id>10003</resource_id>
<resource_type>album</resource_type>
<action>add</action>
<title><![CDATA[标题]]]></title>
<author><![CDATA[作者]]]></author>
<source>新华网</source>
<keyword><![CDATA[北京,雾霾]]]></keyword>
<category>新闻</category>
<release_date>2015-07-26 15:24:50</release_date>
<description><![CDATA[摘要]]]></description>
<guide_image><![CDATA[http://x.cn/a.jpg]]]></guide_image>
<original_url><![CDATA[http://x.cn/xxx.shtml]]]></original_url>
<image_file><![CDATA[http://x.cn/123.jpg,http://x.cn/123.jpg]]]></image_file>
<extends>
<info name="info_name1">value1</info>
<info name="info_name2">value2</info>
</extends>
</resource>
<!--活动资源示例-->
<resource>
<resource_id>10004</resource_id>
<resource_type>activity</resource_type>
<action>add</action>
<title><![CDATA[标题]]]></title>
<organization><![CDATA[活动举办单位]]]></organization>
<act_time>2015-07-02</act_time>
<address>北京市海淀区xxxx</address>
<keyword><![CDATA[北京,雾霾]]]></keyword>
<act_type>线上活动</act_type>
<description><![CDATA[摘要]]]></description>
<guide_image><![CDATA[http://x.cn/a.jpg]]]></guide_image>
<original_url><![CDATA[http://x.cn/a.shtml]]]></original_url>
<act_file><![CDATA[http://a.cn/a.jpg,http://x.cn/a.jpg]]]></act_file>
<extends>
<info name="info_name1">value1</info>
<info name="info_name2">value2</info>
</extends>
</resource>
<!--应用资源示例-->
<resource>
<resource_id>10005</resource_id>
<resource_type>app</resource_type>
<action>add</action>
<app_name><![CDATA[应用名称]]]></app_name>
<app_version>1.0</app_version>
<developer><![CDATA[开发者或开发单位]]]></developer>
<originality>true|false</originality>
<description><![CDATA[摘要]]]></description>
<keyword><![CDATA[北京,雾霾]]]></keyword>
<platform>Android|iOS|HTML5|FLASH</platform>
<app_icon><![CDATA[http://x.cn/a.jpg]]]></app_icon>
<app_images><![CDATA[http://x.cn/a.jpg,http://x.cn/a.jpg]]]></app_images>
<package_link><![CDATA[http://x.cn/xxx.apk]]]></package_link>
<extends>
<info name="info_name1">value1</info>
<info name="info_name2">value2</info>
</extends>
</resource>
</resources>
</data>
三、示例
<?xml version="1.0"encoding="UTF-8"?>
<data>
<interface_version>1.0</interface_version>
<partner>kepuchina.cn</partner>
<lastmod>2015-07-02</lastmod>
<frequent>5</frequent>
<resources>
<!--文章示例-->
<resource>
<resource_id>255582</resource_id>
<resource_type>article</resource_type>
<action>add</action>
<title><![CDATA[综合极端条件实验装置:拓扑物态、量子材料的研究全靠它]]]></title>
<author><![CDATA[王超]]]></author>
<source>科普中国-科技让生活更美好</source>
<keyword><![CDATA[极端条件,实验装置,研究,拓扑物态,量子材料]]]></keyword>
<category>重大工程</category>
<release_date>2017-11-08 14:46:02</release_date>
<description><![CDATA[据中青在线报道, 9月28日,名为“综合极端条件实验装置”的大科学工程在北京怀柔科学城启动建设,这是北京怀柔科学城第一个正式开工的国家重大科技基础设施,也是北京综合性国家科学中心的核心组成部分之一。]]]></description>
<guide_image><![CDATA[http://www.kepuchina.cn/edpage/righttwo/201709/W020170901507546929628.jpg]]]></guide_image>
<original_url><![CDATA[http://www.kepuchina.cn/kpcs/lcb/lcb3/201711/t20171108_255582.shtml]]]></original_url>
<content><![CDATA[<div class=TRS_Editor><p> 据中青在线报道,9月28日,名为“综合极端条件实验装置”的大科学工程在北京怀柔科学城启动建设,这是北京怀柔科学城第一个正式开工的国家重大科技基础设施,也是北京综合性国家科学中心的核心组成部分之一。那么,综合极端条件实验装置的主要建设内容是什么?建成后将达到什么水平?它在未来将有何用处?</p> <p style="text-align: center"><img alt="" src="http://www.kepuchina.cn/kpcs/lcb/lcb3/201711/W020171108531927984635.jpg" OLDSRC="W020171108531927984635.jpg" /></p> <p align="center">综合极端条件实验装置效果图(图片来源:中国科学院物理研究所)</p> <p> 综合极端条件实验装置的主要建设内容是什么?据《北京日报》报道,其主要建设内容包括极端条件物性表征系统、高温高压大体积材料研究系统、极端条件量子态调控系统以及超快条件物质研究系统共四个实验系统,将在北京市怀柔区和吉林省长春市两地分头开工建设。位于北京怀柔科学城的部分占地面积约4.8万平方米,将重点支撑低温、高压、强磁场、超快光场等多种综合极端实验条件下的科研需求。</p> <p> 综合极端条件实验装置建成后能达到什么样的水平呢?据《人民日报》报道,综合极端条件实验装置建成之后,将为非常规超导、拓扑物态、量子材料与器件等方面的研究提供最尖端实验手段的支撑,进而为相关材料的人工设计与制备,以及诸多科学难题的破解提供前所未有的发展机遇。此外,利用综合极端条件实验装置可以使物理实验条件达到极端状态,这样一来,科学家们就可以发现更多新的物态,探索更多新的科学现象,开辟新的领域,从而大大拓展人类认识自然、改造自然、造福人类自身的能力。</p> <p> 此外,据人民网科技频道报道,这套装置的科研应用价值巨大。不仅可以开展非常规超导、拓扑物态、新型量子材料与器件等方面的研究工作,还可在物理、材料、化学和生物医学等领域开展超快科学研究,探索极端时空尺度上的物质结构信息和动力学信息,同时促进凝聚态物理、材料科学、化学等不同学科之间的相互渗透、交叉融合。</p> <p> 中国科学院副院长王恩哥在接受人民网科技频道采访时表示,“希望综合极端条件实验装置能够建设成为世界领先的用户装置,与相关交叉平台一起构成具有全球影响力的凝聚态物质科学研究中心。”(孔睿)</p> <p><strong> 本文由中科院物理所研究员吴光恒进行科学性把关,专家主要研究领域为磁电子学、半导体、磁性智能材料、材料物理、精密机械和智能器件等。</strong></p> <p style="text-align: center"><img alt="" src="http://www.kepuchina.cn/kpcs/lcb/lcb3/201711/W020171108531927984544.jpg" OLDSRC="W020171108531927984544.jpg" /></p></div>]]]></content>
<extends>
<info name="info_name1">value1</info>
<info name="info_name2">value2</info>
</extends>
</resource>
</resource>
</resources>
</data>
四、注意事项
- 所有的元素必许拥有关闭标签
- 元素对大小写敏感
- 元素必需被正确地嵌套
- 属性值必须带引号
五、备注
<title>和<content>两个字段内容,请使用<![CDATA[内容]]]>这种格式,避免解析乱码
-
XML中请勿使用字符实体[转义符],如
<>
请勿写成<>
; -
建议XML中保留resource条目不要超过100条,避免文件过大
-
XML刷新频率请大于1小时
-
文章的Link地址必须是唯一的不变的,同一个URL的多篇文章只会采集到一篇
-
文章正文需全部输出,使用
html
格式文本,例如<p>
段落,<a>
链接,<img>
图片 -
最新文章应在XML feed文档的最前面
<release_date>字段,使用格式化时间:
<release_date>2015-07-26 15:24:50</release_date> -
如果有屏蔽动作,请设置我们的采集IP为白名单:
- 180.76.135.40
- 36.110.12.198
- 139.129.224.70
- 118.190.87.165
- 114.215.223.1
- 118.190.124.133
正确的时间格式:
<release_date>2015-07-26 15:24:50</release_date>
关于更新频率:
目前有两种形式:
- 增量接口:根据当天发布的数据量为准,建议增量接口整个xml里面所保存的条目不要超过100条,对实时数据进行读取,xml接口需保持实时更新。
- 全量接口(历史数据XML):以周、月或年为单位,进行更新,永久生效,若有变更需要及时通知。其中涉及各科普信息化建设项目合同执行单位已经完成资源及2016年新制作的资源内容。
特别提醒:
- 确定XML格式正确
- 字符编码使用 UTF-8
- 文章正文输出在
<description><![CDATA[]]]></description>
中,且输出全文 -
<link></link>
标签中的地址必须唯一,且无二次跳转,且每次访问时地址必须一致 - 文章标题和文章正文使用
<![CDATA[]]]>
标签转义 - 文章正文使用全文输出
- URL使用绝对路径
- 请勿使用HTML实体名称,例:
<>
直接用<>
表示,而不是用表示<>
- XML中最新文章尽量保持在最前面
- 所有的元素必须拥有关闭标签,即标签是成对出现的,如:
<title></title>
- 元素必须被正确的嵌套
- 属性值必须带引号
网友评论