美文网首页
我的个人数据存储与自动备份策略

我的个人数据存储与自动备份策略

作者: 刘娟娟 | 来源:发表于2021-12-11 14:16 被阅读0次
    image

    我以前喜欢直接在公共平台上写东西,也就是打开网站或应用的编辑器直接敲键盘。无论那是只言片语的微博,一段心得感想又或者一篇文章。现在,我已经改掉了这个习惯。

    我会先在本地编辑器生产所有数据,然后再拷贝到合适的公共平台发布;本地数据文件我采用 git 生成版本记录,并自动往 github 推送,进行云备份。

    我的这些本地数据表现为一个个文件夹和文件。通常是 markdown 文件,少量的 ipynb 或 python 源码文件,以及一些文档文件、图片等。

    我通常采用 Obsidian、Vscode 或是 Jupyter Lab 打开这些文件 …… 这些工具可统称为编辑器。前两个适合文本,后两个适合文本和源代码。

    这些本地数据需要备份,以防本地设备异常损毁导致数据丢失。由于手动备份到另外一份物理介质上(比如说移动硬盘)非常费神,目前我只是把它们提交到 github 私有仓库上存档。

    往 github 私有仓库存档,有 3 种操作方式,这三者的生产效率也越来越高。

    最初,我会在 vscode 上访问这些私有仓库的本地文件夹,手动敲出几行命令并执行它。我总是需要等待命令执行完毕,才能切换并处置下一个私有仓库。

    后来,我写了一段简单代码来自动执行。它采用 Python 写成:自动生成 git 命令,写入一个批处理的临时文件,然后执行该批处理文件,最后把临时文件删除。

    这段 Python 代码长这样:

    
    """自动提交私有仓库到 github 上备份"""
    import os
    
    # 我的私有仓库
    repos = [
        "D:\\MY-OBSIDIAN-DATA\\my_Timedata",
        "D:\\MY-OBSIDIAN-DATA\\my_Schedule",
        "D:\\MY-OBSIDIAN-DATA\\my_Writing",
    ]
    
    # 我对私有仓库的 git 操作
    cmds = {
        "status": "git status\n",
        "push": 'git add .\ngit commit -m "update"\ngit push origin master\n',
    }
    
    # 生成批量命令并执行
    def auto_git(command):
        lines = []
        tempfile = r"D:\MY-OBSIDIAN-DATA\temp.bat"
        for repo in repos:
            lines.append(f"cd {repo}\n")
            lines.append(cmds[command])
    
        with open(tempfile, "w") as f:
            f.writelines(lines)
        os.system(tempfile)
        os.remove(tempfile)
    
    asku = input("0 byebye.\n1 status\n2 push")
    if asku == "0":
        print("byebye.")
    elif asku == "1":
        command = "status"
    else:
        command = "push"
        
    auto_git(command)
    
    

    它省掉了“打开编辑器、切换到不同仓库、手动敲下命令行、等待执行结束”的重复操作。这些重复操作毫无技术含量,用代码来自动执行正是我自学 Python 的一大成就感所在。

    但它依然是一份手动触发的代码,我需要记住:不定期(比如尽量每天)多次执行该代码。想要进一步降低大脑负担,让它每天自动执行,那就可以用到 windows 的任务计划程序。具体如何设置呢?搜索“windows 任务计划程序”,网上有很多详尽的图文攻略。

    最初的 Python 代码有 input() 来做人机交互,可以查看仓库状态和提交,还可以扩展更多操作。但如果转为定时任务,则直接执行提交即可。代码稍做调整后变成了:

    
    """自动提交私有仓库到 github 上备份"""
    import os
    
    # 我的私有仓库
    repos = [
        "D:\\MY-OBSIDIAN-DATA\\my_Timedata",
        "D:\\MY-OBSIDIAN-DATA\\my_Schedule",
        "D:\\MY-OBSIDIAN-DATA\\my_Writing",
    ]
    
    # 我对私有仓库的 git 操作
    cmds = {
        "status": "git status\n",
        "push": 'git add .\ngit commit -m "update"\ngit push origin master\n',
    }
    
    # 生成批量命令并执行
    def auto_git(command):
        lines = []
        tempfile = r"D:\MY-OBSIDIAN-DATA\my_auto_task\tempfile.bat"
        for repo in repos:
            lines.append(f"cd {repo}\n")
            lines.append(cmds[command])
    
        with open(tempfile, "w") as f:
            f.writelines(lines)
        os.system(tempfile)
    
    def asku():
        """交互式获取命令,可查询状态或提交"""
        asku = input("0 byebye.\n1 status\n2 push")
        if asku == "0":
            return print("byebye.")
        elif asku == "1":
            command = "status"
        else:
            command = "push"
        auto_git(command)
    
    auto_git("push")
    
    

    一条定时任务,对于计算机和人类来说,依然是一份数据。你可以在任务计划程序的图形界面上手动设置,也可以导出已有任务得到一份 xml 文件作为模板,然后修改好参数后,回到任务计划程序的图形界面上导入它。当然,记得在界面上查看和修订参数,以确保参数符合预期。

    一条定时任务的 xml 文件长这个样子:

    
    <?xml version="1.0" encoding="UTF-16"?>
    
    <Task version="1.2" xmlns="http://schemas.microsoft.com/windows/2004/02/mit/task">
    
     <RegistrationInfo>
    
     <Date>2019-09-17T12:54:56.301647</Date>
    
     <Author>MSI\75801</Author>
    
     <URI>\my_github_private_repo_push3</URI>
    
     </RegistrationInfo>
    
     <Triggers>
    
     <CalendarTrigger>
    
     <StartBoundary>2019-09-17T12:56:00</StartBoundary>
    
     <Enabled>true</Enabled>
    
     <ScheduleByDay>
    
     <DaysInterval>1</DaysInterval>
    
     </ScheduleByDay>
    
     </CalendarTrigger>
    
     </Triggers>
    
     <Principals>
    
     <Principal id="Author">
    
     <UserId>S-1-5-21-4053500361-574701572-2713609324-1001</UserId>
    
     <LogonType>InteractiveToken</LogonType>
    
     <RunLevel>LeastPrivilege</RunLevel>
    
     </Principal>
    
     </Principals>
    
     <Settings>
    
     <MultipleInstancesPolicy>IgnoreNew</MultipleInstancesPolicy>
    
     <DisallowStartIfOnBatteries>true</DisallowStartIfOnBatteries>
    
     <StopIfGoingOnBatteries>true</StopIfGoingOnBatteries>
    
     <AllowHardTerminate>true</AllowHardTerminate>
    
     <StartWhenAvailable>false</StartWhenAvailable>
    
     <RunOnlyIfNetworkAvailable>false</RunOnlyIfNetworkAvailable>
    
     <IdleSettings>
    
     <Duration>PT10M</Duration>
    
     <WaitTimeout>PT1H</WaitTimeout>
    
     <StopOnIdleEnd>true</StopOnIdleEnd>
    
     <RestartOnIdle>false</RestartOnIdle>
    
     </IdleSettings>
    
     <AllowStartOnDemand>true</AllowStartOnDemand>
    
     <Enabled>true</Enabled>
    
     <Hidden>false</Hidden>
    
     <RunOnlyIfIdle>true</RunOnlyIfIdle>
    
     <WakeToRun>true</WakeToRun>
    
     <ExecutionTimeLimit>PT0S</ExecutionTimeLimit>
    
     <Priority>7</Priority>
    
     <RestartOnFailure>
    
     <Interval>PT1M</Interval>
    
     <Count>3</Count>
    
     </RestartOnFailure>
    
     </Settings>
    
     <Actions Context="Author">
    
     <Exec>
    
     <Command>C:\ProgramData\Anaconda3\python.exe</Command>
    
     <Arguments>D:\MY-OBSIDIAN-DATA\my_auto_task\github_private_repo_push.py</Arguments>
    
     <WorkingDirectory>D:\MY-OBSIDIAN-DATA\</WorkingDirectory>
    
     </Exec>
    
     </Actions>
    
    </Task>
    
    

    现在,我再也不用耗费心力记住自己是否往 github 上提交私有仓库的数据备份,因为它已经被设定了自动执行。

    笑来老师最近说到,同样的智能设备,在不同人手中发挥的作用截然不同。痴迷于熟悉自己的生产工具并提高生产效率,总归是件好事。希望我的分享带给你一点启发。

    相关文章

      网友评论

          本文标题:我的个人数据存储与自动备份策略

          本文链接:https://www.haomeiwen.com/subject/agpkfrtx.html