VirusShare
VirusShare是一个恶意软件样本库,为安全研究人员提供访问恶意代码样本的机会。只有通过邀请才能进入该网站。目前该网站是需要发邮件给管理人员才能被邀请注册。
VirusShare Link
样本下载
某C站上有VirusShare样本的相关资源,居然是收费的,实在是不能理解。。。
csdn.png
我这里贴出一个收集VirusShare样本torrent的网站,可以直接下载样本,样本大小总计10T以上。。。。。
image.png
网页xml
获取样本相关信息:
import requests
import pandas as pd
import xml.etree.ElementTree as ET
def download_xml():
url = "http://71.105.224.114:6969/rss_feed.xml"
r = requests.get(url)
if r.status_code == 200:
xml = r.content
with open("dom.xml", "wb") as fp:
fp.write(xml)
def save_data():
title = []
description = []
link = []
guid = []
pubDate = []
torrent_sha1 = []
torrent_size = []
tree = ET.parse("dom.xml")
ii = tree.findall("./channel/item")
for i in ii:
title.append(i.find('title').text)
description.append(i.find('description').text)
link.append(i.find('link').text)
guid.append(i.find('guid').text)
pubDate.append(i.find('pubDate').text)
torrent_sha1.append(i.find('{http://azureus.sourceforge.net/files/rss/}torrent_sha1').text)
torrent_size.append(i.find('{http://azureus.sourceforge.net/files/rss/}torrent_size').text)
csv_path = "virus_share_torrent.csv"
df = pd.DataFrame({"title": title,
"description": description,
"link": link,
"guid": guid,
"pubDate": pubDate,
"torrent_sha1": torrent_sha1,
"torrent_size": torrent_size})
df.to_csv(csv_path)
def main():
download_xml()
save_data()
if __name__ == "__main__":
main()
拿到文件名和链接等信息,扔进迅雷或者其他下载工作慢慢下载
image.png
网友评论