Git 版本控制系統 (1)

自從去年 Rails 改用 Github hosting 之後,就想學 Git 很久了(一直以來都只會像 svn 一樣操作 add, rm commit, push, pull 而已,如果你的程度也是如此,建議你可以再多學學)。今年許下的第一個目標就是認真學會 Git,而直到上個月和多開始陸陸續續把所有的 svn repo. 都換成 git,才開始非得天天用 git 的日子 :p

Git 是由 Linus Torvalds(Linux 發明人,發明 Git 的目的之一就是用來管理 Linux 原始碼) 發展出來的 content tracker 系統,它的內部設計像是檔案系統,而不是 SCM 系統,雖然它最主要的用處是拿來做 DVCS。

這裡最重要的理解就是:他追蹤的是資料內容,不是記錄版本間的差異。所以即使是改檔名或是在不同的 branch 裡面,相同的內容仍然只會有一份實體,其他都是利用 metadata 建立 reference 關聯。這也是為什麼它比起 SVN 又快又省空間又有效率,分支 branch 跟 tag 超快(只是建立 reference 而已),而且也可以改檔名(在 SVN 要刪除再新增,真是 sucks)。

因為 Git 比起 SVN 實在先進多了,除了比較難上手一些之外,我想這幾年應該會大規模的取代 SVN 成為新霸主吧(Why Git is Better than X),它目前最大的缺點是 Windows 上的支援還不是非常成熟。如果您想看看其他選擇,聽說 Hg 這套 DVCS 也是非常不錯 (快把 SVN 丟了吧)。

認真學會了一套分散式版本控制系統 DVCS,對專案開發真是幫助不少,以往我會對 branch 感到害怕,覺得是高級的技巧,學會 Git 之後這件事變成一個非常 easy 的開發技巧,不像 svn copy 跟 svn merge 令人抗拒。這對一個已經在上 production 的軟體來說幫助極大,因為必需同時維護 stable 的版本只做 bug fixes,以及數個 development branch 同時開發不同 topic/features。

另一好處是分散式 SCM 有本地端 Repo.,因此不需要網路就可以 commit 了,因此有時候做高鐵或等車想寫 Code 也就不需要網路了。而且本地端 Repo. 看 log 超快超方便,看 SVN Log 真是超級痛苦的網路延遲。另一個比較進階的長處是:只要在本地端還沒有 Push 分享給別人,你都可以修改 commit histroy。這是非常 powerful 的能力,例如我可以取消前一次或任一次的 commit、變更 commit 順序、移動 local branch 的分支點、將數個 commit 合併成一個、將一個 commit 打散成數個等等,因此可以在本地端都確認 okay 準備好才 Push 分享給別人。這種流程我自己也在試著改變,以往 svn 的經驗會讓你習慣一 commit 就馬上 push,但是使用 git 的話其實不需要這麼急著把還不完整的程式分享出去。

我的主要教材的是 Pragmatic Version Control Using Git 一書和 Git Internals PDF,前者很容易閱讀,後者比較概括性一些甚至開頭就先介紹了內部的運作。除了官方的說明文件,其他推薦的 Git 學習網頁有:

除了安裝 Git command,使用 GUI 軟體看分支線圖可是使用 Git 的樂趣之一。其中 MAC 上的 GitX 軟體超級推薦,內建的則有 gitk 和 git-gui。

Setup

使用 Git 的第一步是務必設定好你的名子跟email,該檔案會在 ~/.gitconfig,可以用以下指令直接加入:


git config --global user.name "ihower"
git config --global user.email "ihower@gmail.com"

接著是建立 repo.,有兩種方式:


git init <dir_name> 會在本地新建一個 repo.。
git clone <remote_location> 會從遠端複製一份 repo 回來。

以下介紹的操作都跟 remote repo. 沒有關係,都只是在本地 repo. 操作。(作為一個 DVCS,本地端目錄就會包含所有的 commit 紀錄)

add, status, commit (working tree and staging area)

Working tree 是你當下的工作目錄,就像 SVN checkout 出來的工作目錄。這裡要特別學習的新概念是 Staging area,這是 Git 獨有的功能。它是一塊暫存的 cached 區域,用來紀錄什麼是你待會要 commit 檔案。


git add . 加入所有檔案,包括所有還沒有被追蹤(untracked)的檔案
git add -i 進入互動模式,你甚至可以只 Add 檔案裡面其中的一段程式碼到 staging area 去(稱作patch)
git add -u 只加更新的檔案,不加入還沒有追蹤的檔案 (跟 git commit -a 涵蓋的範圍相同)

使用 git add 會將檔案加入 staging area 中,特別注意到待會的 commit 是 commit 你執行 add 時當下的檔案,而不是最後的版本。(也就是如果你 add 完之後又再次修改同個檔案,commit 出去的檔案是第二次修改前的版本)

接著也是最常用的 git status,會列出以下狀態:

  • Changed but not updated 有修改但是沒有加入 staging area 的檔案
  • Changes to be committed (staging area) 已經加入 staging area 的檔案
  • Untracked 還沒有被追蹤的新檔案

然後是 commit 指令,會把 Staging area 裡面的東西 commit 出去:


git commit -m "blah" 如果沒加 -m 的話, 會開編輯器輸入 commit log (可以在.gitconfig中設定編輯器)
git commit -a -m "foobar" 全部修改的檔案都 add 後 commit 出去 (不包括 untracked 的新檔案)
git commit -v 會開編輯器加上 diff 註解

其他常見操作有:


git rm foobar 刪除
git mv old_file new_file 改檔名

Git 沒有 git copy,因為既然 Git 不是 track file, 而是 track content,所以當你新建一個檔案把相同內容貼上去,Git 會知道你貼上去的東西從哪裡來的,也不需要你告訴 Git 你在 copy。

也因為多了一層 staging area 的存在,所以 diff 細分成三種


git diff 是比較 working tree 跟 staging area
git diff --cached 是比較 staging area 跟本來的 repo.
git diff HEAD 是比較 working tree 跟本來的 repo.

後幾篇還會提到更多如何做回復動作,這裡先介紹兩個指令:


git reset HEAD filename 會從 staging area 狀態回到 unstaging 或 untracked (檔案內容並不會改變)
git checkout filename 會從 unstaging 狀態回到最初 repo. 的檔案(檔案內容變回修改前)

最後一提的是 .gitignore,這個檔案可以編輯列出哪些檔案是要忽略不需要 tracked 的,像 Rails 就會加入 log/*.log 和 tmp/**/* 。

Git 還有項比較特立獨行的行為是空目錄是不會 commit 出去的,這在某些專案可能會是問題(例如 Rails 如果少了 log 或 tmp 目錄會不能啟動),解決辦法是在該目錄下 touch 一個空的檔案,慣例是 .gitkeep。

(請期待續集:開 Branch 分支、操作遠端 Repo.、還沒 push 前可以幹的壞事以及其他奇技淫巧)

15 thoughts on “Git 版本控制系統 (1)

  1. 感謝前輩分享git心得啊.. 我也是對這種東西有一種恐懼感,很怕一不小心就搞壞別人的東西= =”

  2. 你寫的文章很好,幫助我對git的觀念做了補完 :)

    “也可以改檔名(在 SVN 要刪除再新增…”
    svn 有 svn move (mv, rename, ren) 可以改檔名。

    “Git 沒有 git copy,因為既然 Git 不是 track file, 而是 track content,所以當你新建一個檔案把相同內容貼上去,Git 會知道你貼上去的東西從哪裡來的,也不需要你告訴 Git 你在 copy。”

    我剛才試了一下,我複製了一個檔案,再 git add
    再用 git log去看
    發現它的history並不會包含母檔案的history

    svn copy 的功用就是做到上面說的。

    有時候你新增一個檔案,該檔案的內容其實基於母檔案,
    而且母檔案的history 非常有參考價值
    (試想它是一個原始碼檔,含有非常多的bug fix)
    我會希望新檔案可以包含過去的這些 history

    我儘可能不要憑空生出一個擁有一大堆程式碼卻全新的檔案
    有時想要追這個檔案是從那個地方複製過來的
    得猜半天…

    svn (command line)可以local or remote copy 一個檔案
    不過 Tortoise SVN 沒有提供 local copy 的選項

  3. 请问git能解决对发布版本的控制吗?就是能防止代码发布后其他人再去改动代码吗?谢谢

  4. 在玩Git的時候有些疑問想請教
    通常修改好檔案之後 add 要從staging area 移除是靠reset HEAD 吧?
    直接下 git rm 卻error: ‘xxx’ has changes staged in the index
    但 直接下rm 在status 又多了一種狀態 Changes not staged for commit
    此時根據出現的提示 在下git rm 就可以移除 這部份是為啥呢
    在實際操作中是不是要commit 才能 git rm呢?
    觀念上有點小混亂

  5. yes, git rm 是指刪除已經commit的檔案。
    放在 staging area 的修改要 unstage 打 git reset HEAD file_name
    不在 staging area 的修改要回復是打git checkout file_name
    如果想從 staging area 直接回復,可以打 git reset HEAD file_name --hard

Leave a Reply