美文网首页Python&机器学习自动化测试成长励志
Github 2019 年最值得关注的数据科学项目 Virgil

Github 2019 年最值得关注的数据科学项目 Virgil

作者: iOSDevLog | 来源:发表于2019-04-04 00:13 被阅读972次
    map.png

    项目地址:https://github.com/clone95/virgilio

    目前为止: [7,128] star [1,303] fork,希望你看到之后能给它添加一个 star

    这个项目首次提交在 2019 年 3 月 12 日,原名叫https://github.com/clone95/Data-Science-Study-Paths-March-2019,一个月的时间就有 6k+ 个 star,经常排在 http://github.com/explorer 的前几位。当然最近被榜单被 996icu 占了。

    关于项目改名:

    Virgilio.png

    项目作者把项目名改成维吉尔(Virgilio),这是 13 世纪末意大利诗人但丁所著长诗《神曲》中旦丁的导师。

    这是什么地方?

    通过互联网进行学习意味着在无限的混乱信息丛林中游泳,在快速变化的创新领域更是如此。

    当你试图接近一个没有真正 “路径” 的新主题时,你有没有感到不知所措?你是否妨碍获得深厚的知识和应用它的能力?

    嗨,我是 维吉尔(Virgilio)

    就像几年前我和 但丁(Dante) 一样,在你的互联网旅程中,我将成为你的导师和参考点,为你提供完整的有机学习途径,包括多个领域,工具,技能等。

    我是怎么做到的?

    我试图简明扼要,以避免信息开销。

    我按层次结构和复杂程度组织了内容,以便你对事物的运作方式有一个连贯的想法。

    你将学习如何通过实践项目理解和应用理论,并仔细遵循我的提示和技巧,你将从头开始掌握新技能。

    你不需要任何先前的主题知识,但对编程和高中数学有信心,以理解和实现大多数概念。

    此处列出的每个来源都是免费或开源的。

    我最感兴趣的是数据科学,因为我试图预测耶路撒冷的陨落,但是你知道,那时我们没有那么多的计算能力!

    你能在这里找到什么?

    我为你打包了几种类型的指南:

    • 职业:完整的学习路径,指导你从头开始掌握新技能。
    • 主题:关于由子领域组织的特定主题,方法和现实应用的综合指南。
    • 专业化:个人技能的垂直指南。
    • 工具:单一工具或技术的深入指南。
    • 研究:对最新论文和技术文件的最新审查和解释。
    • 元(Meta):这些主要是关于如何学习和接近新概念的指南。

    如果你发现此 repo 有用,我请你 star 一下,与你的朋友和同事分享,然后点击 watch,因为每天都会有更新!

    我的目的是什么?

    我的目标主要是帮助人们开始使用创新的领域和技术,即使你从未尝试过编写代码,或者你需要深入的数学评介,我也会给你这样的基础。因此,你可以成为一名学生,另一个领域的工作人员或经理,你将在这里找到你需要做好准备,以应对未来几年肯定会发生的破坏性和不可预测的市场和社会转型。

    我的价格:我在这里等你,免费。如果你发现我在某种程度上有所帮助,我只要求你留下一个 star ,点击 watch,每次你有机会时请分享我。让我们开始我们的旅程!

    新接触数据科学?

    基础 Python

    基础数学 - 即将推出

    高级 Python - 即将推出

    高级数学 - 即将推出

    Python 数据科学

    数学数据科学 - 即将推出

    完整的学习路径

    机器学习研究路径

    商业智能研究路径 - 即将推出

    云计算研究路径 - 即将推出

    专业化

    数据预处理

    数据收集 [即将推出 - 下一步]

    数据可视化 [即将推出]

    有效沟通 [即将推出]

    有效陈述 -

    实用决策 [即将推出]

    工具

    Latex

    Wolfram Alpha

    GeoGebra

    正则表达式

    即将推出

    主题

    DialogFlow 和 Flask 打造 ChatBot

    研究

    Zotero

    最新论文 [即将推出]

    关于专业化

    你可以按顺序选择它们或选择最适合你的那个,但我建议你至少要一次把它们都看完。

    我计划了两种类型的专业化:硬技能和软技能

    前者是关于技术流程,是每个处理数据的人的核心工具包。使用数据是一种艺术形式,经验法则和最佳实践将帮助你了解处理它们的方式。你需要对如何处理数据产生一种 “感觉”,这种 “感觉” 主要是由情况和经验驱动的。因此,这些专业将强烈关注练习和练习。

    后者是关于... 所有未写在技术书籍中的东西。使用和掌握它们,因为它们是你真正的价值促成者。你可以成为世界上最好的开发人员或工程师,但如果你无法向受众传达你的建议和发现,或者使用数据来建议现实世界中的实际行动,那么你对公司来说就毫无用处。

    关于主题

    单个主题将按字段分割,它们可以触及实际应用程序,方法,技术栈,最佳实践等。

    关于工具

    “工具” 部分将提供有关你需要了解的特定技术 / 语言 / 方法的所有指南!它们将为你提供彻底探索和掌握手头工具的方法。

    订阅我们新闻发布和更新的FACEBOOK组

    翻译人员

    @jiaxianhua (iOSDevLog)

    在我准备翻译之前就已经有中国人准备翻译成中文,后来共有 4 个中国人想要翻译成中文。

    我们重新建了一个 https://telegram.org/ 中文聊天群 Virgilio_cn,并把 @Clone95 拉进群,准备我们的翻译计划。

    一开始人打算可以使用有团队协作功能的 蚂蚁笔记 Leanote,它具有以下特性。

    • Markdown 编辑器
      实时同步预览,你只需使用键盘专注于书写文本内容,就可以生成印刷级的排版格式。
    • 详细历史纪录
      每次保存都在后端备份,轻松查找,一键恢复。
    • 实时同步 - 云协作版
      丰富的团队权限管理完整的文档树型结构
      支持Docker,私有云部署实时IM群聊讨论

    最重要的是它是开源的:https://github.com/leanote

    于是我把它部署在服务器。

    后来 @Clone95 找到了 WebLate

    Weblate 是一个基于网络自由软件持续本地化系统。

    WebLate

    这个也是开源的,我把它也部署在服务器上http://67.218.132.50/

    部署过程:https://www.jianshu.com/p/f3cd7dfd48d1

    Weblate 支持多种翻译格式,我选择把 md 文件改换成 xliff 再上传。

    Weblate 还支持机器翻译https://docs.weblate.org/en/latest/admin/machine.html

    大多数翻译 API 要收费,也包括流行的 Google Translate。最终我选用了 Baidu API machine translation ,每月翻译字符数低于200万,享免费服务;超过200万字符,需按照49元人民币/百万字符支付当月全部翻译字符数费用(包括之前免费的200万字符)。

    转换几个文件后,翻译群里的小伙伴们就开始翻译。之后又发现 Xliff 要把 md 文件里的 "<>&" 这些符号替换成占位符。好麻烦,还不如直接用 json 格式。

    转换方式:https://www.jianshu.com/p/323a5d033767

    最终还是用 google translate api 直接翻译 md 文件。

    转换过程:https://www.jianshu.com/p/5835eb34cbb1

    用 vscode 一边英文,一边中文对照着改通顺。

    vscode.png

    翻译中肯定有许多不专业的地方,特别是 WolframAlpha 的翻译,请大家将不准确的地方提出,或者加入我们的 Telegram / 微信翻译群。

    微信公众号:AI开发日志(AIDevLog)

    AI开发日志

    最后还是请大家 star 并分享给你的好友们!

    https://github.com/clone95/virgilio

    相关文章

      网友评论

        本文标题:Github 2019 年最值得关注的数据科学项目 Virgil

        本文链接:https://www.haomeiwen.com/subject/clitiqtx.html