美文网首页vuejsGIt
Git库空间优化

Git库空间优化

作者: 真徐小白 | 来源:发表于2016-01-24 15:21 被阅读1708次

Git库随着使用时间的延续,空间会不断增长,但实际代码其实只占很小的空间,更多的是git库本身的归档文件,其中包括已删除的文件纪录。Git优化的本质就是清除已删除文件的归档历史,并重写commit记录。

另外可以将git中变化很少,与代码无关的文件移除,如一些资源文件,放到统一的位置,可以减小很大一部分空间占用。

1. 克隆远程库到本地

$ git clone remote-url

用下面的脚本获取所有分支.

#!/bin/bash
for branch in `git branch -a | grep remotes | grep -v HEAD`
do 
  git branch --track ${branch##*/} $branchdone
done

现在你拥有了远程git库的完整克隆,可先在本地进行一些测试、验证工作。

2. 分析git库

代码文件一般都很小,Git库的优化主要从大文件入手。
用下面的脚本可以找出git归档记录中排名前十的大文件,包括已删除的文件。

#!/bin/bash
#set -x 

# Shows you the largest objects in your repo's pack file.
# Written for osx.
#
# @see http://stubbisms.wordpress.com/2009/07/10/git-script-to-show-largest-pack-objects-and-trim-your-waist-line/
# @author Antony Stubbs

# set the internal field spereator to line break, so that we can iterate easily over the verify-pack output
IFS=$'\n';

# list all objects including their size, sort by size, take top 10
objects=`git verify-pack -v .git/objects/pack/pack-*.idx | grep -v chain | sort -k3nr | head`

echo "All sizes are in kB. The pack column is the size of the object, compressed, inside the pack file."

output="size,pack,SHA,location"
for y in $objects
do
    # extract the size in bytes
    size=$((`echo $y | cut -f 5 -d ' '`/1024))
    # extract the compressed size in bytes
    compressedSize=$((`echo $y | cut -f 6 -d ' '`/1024))
    # extract the SHA
    sha=`echo $y | cut -f 1 -d ' '`
    # find the objects location in the repository tree
    other=`git rev-list --all --objects | grep $sha`
    #lineBreak=`echo -e "\n"`
    output="${output}\n${size},${compressedSize},${other}"
done

echo -e $output | column -t -s ', '

比较输出结果与现有git库中的文件,可以分为以下3类:

  1. 只存在归档于历史中,这部分是已删除的文件,可以直接在归档纪录中抹去。
  2. 归档历史和Git库都存在,但可以移除的文件,这部分文件应先从git库中删除,再抹去归档历史的纪录。
  3. 正常的代码文件,不作处理。

3. 清理git库

用下面的命令从归档历史中清理已删除的文件,并重写commit记录。

$ git filter-branch --tag-name-filter cat --index-filter 'git rm -r --cached --ignore-unmatch FILENAME ' --prune-empty -f -- --all

将FILENAME替换为文件名,多个以空格分隔, 可以用*匹配目录。
执行完成后,归档历史已经清理完成,但还有一些垃圾文件,用下面的命令清理.

$ rm -rf .git/refs/original/
$ git reflog expire --expire=now --all
$ git gc --prune=now
$ git gc --aggressive --prune=now

ok,到此,大功告成,du -sh . 可以看到成果。

4. push优化后的代码到远处仓库

$ git push origin --force --all
$ git push origin --force --tags

操作前一定做好备份,告知所有成员,优化完成后需要重新clone代码.

文中的脚本和命令参考了下面的文章:
http://stevelorek.com/how-to-shrink-a-git-repository.html

相关文章

  • Git库空间优化

    Git库随着使用时间的延续,空间会不断增长,但实际代码其实只占很小的空间,更多的是git库本身的归档文件,其中包括...

  • iOS--本地私有库和远程私有库(二)

    (二)本地私有库创建及优化 ⅰ.普通版 1.在本地创建库文件 git initgit add .git commi...

  • git学习总结

    工作空间 暂存区 版本库 1.常用命令 git diff 非暂存区的变化 git diff --cached 查看...

  • .git 目录太大

    查看磁盘占用空间 更新清理优化 git gc --prune= 对指定日期之前的未被关联的松散对象进行清理

  • 浅析git底层存储原理 2021-07-14

    git三区 git三大区:工作区、暂存区和git版本库 1.git版本库 先从git版本库说起,git版本库对应....

  • git命令

    git init 相应目录下创建git空间 git add X git空间增加控制文件 git add . 添加全...

  • git 将本地文件同步到远程同名目录

    情景:本地代码为非Git库,远程已经建好同名git库,要将本地代码上传到该库。 //初始化本地git库$git i...

  • git命令总结

    Git 命令总结: 创建版本库 克隆远程版本库 $ git clone 初始化本地版本库 $ git init #...

  • zabbix优化之进阶版

    官网调优 1. 数据库优化 1.设置数据库分区优化,buffer优化,hash优化, 说明:数据库分区优化的优点:...

  • git迁移

    git clone --bare 原库/仓库.gitcd /仓库git push --mirror 新库/仓库.git

网友评论

    本文标题:Git库空间优化

    本文链接:https://www.haomeiwen.com/subject/khbrkttx.html