Git 🌙
Chapters â–Ÿ 2nd Edition

9.2 Git et les autres systĂšmes - Migration vers Git

Migration vers Git

Si vous avez une base de code existant dans un autre SystĂšme de ContrĂŽle de Version (SCV) mais que vous avez dĂ©cidĂ© de commencer Ă  utiliser Git, vous devez migrer votre projet d’une maniĂšre ou d’une autre. Cette section passe en revue quelques importateurs pour des systĂšmes communs, et ensuite dĂ©montre comment dĂ©velopper votre propre importateur personnalisĂ©. Vous apprendrez comment importer les donnĂ©es depuis plusieurs des plus gros systĂšmes de gestion de configuration logicielle (SCM, Software Configuration Management) utilisĂ©s professionnellement, parce qu’ils comportent la majoritĂ© des utilisateurs qui basculent, et parce que des outils de haute qualitĂ© dĂ©diĂ©s sont faciles Ă  se procurer.

Subversion

Si vous avez lu la section prĂ©cĂ©dente concernant l’utilisation de git svn, vous pouvez utiliser facilement ces instructions pour git svn clone un dĂ©pĂŽt ; ensuite, vous pouvez arrĂȘter d’utiliser le serveur Subversion, pousser vers un nouveau serveur Git, et commencer Ă  l’utiliser. Si vous voulez l’historique, vous pouvez obtenir cela aussi rapidement que vous pouvez tirer les donnĂ©es hors du serveur Subversion (ce qui peut prendre un bout de temps).

Cependant, l’import n’est pas parfait ; et comme ça prendra tant de temps, autant le faire correctement. Le premier problĂšme est l’information d’auteur. Dans Subversion, chaque personne qui crĂ©e un commit a un utilisateur sur le systĂšme qui est enregistrĂ© dans l’information de commit. Les exemples dans la section prĂ©cĂ©dente montrent schacon Ă  quelques endroits, comme la sortie de blame et git svn log. Si vous voulez faire correspondre cela Ă  une meilleure donnĂ©e d’auteur Git, vous avez besoin d’une transposition des utilisateurs Subversion vers les auteurs Git. CrĂ©ez un fichier appelĂ© users.txt qui a cette correspondance dans un format tel que celui-ci :

schacon = Scott Chacon <schacon@geemail.com>
selse = Someo Nelse <selse@geemail.com>

Pour obtenir une liste des noms d’auteur que SVN utilise, vous pouvez lancer ceci :

$ svn log --xml | grep author | sort -u | \
  perl -pe 's/.*>(.*?)<.*/$1 = /'

Cela gĂ©nĂšre la sortie log dans le format XML, puis garde seulement les lignes avec l’information d’auteur, rejette les doublons, enlĂšve les Ă©tiquettes XML. (Bien sĂ»r, cela ne marche que sur une machine ayant grep, sort et perl installĂ©s.) Ensuite, redirigez cette sortie dans votre fichier users.txt afin que vous puissiez ajouter l’information d’utilisateur Git Ă©quivalente prĂšs de chaque entrĂ©e.

Note

Si vous essayez ceci sous Windows, c’est là que vous commencez à avoir des problùmes. Microsoft a fourni quelques bon conseils et exemples sur https://docs.microsoft.com/en-us/azure/devops/repos/git/perform-migration-from-svn-to-git.

Vous pouvez fournir ce fichier Ă  git svn pour l’aider Ă  faire correspondre la donnĂ©e d’auteur plus prĂ©cisĂ©ment. Vous pouvez aussi demander Ă  git svn de ne pas inclure les metadonnĂ©es que Subversion importe normalement, en passant --no-metadata Ă  la commande clone ou init.

Note

Vous devez conserver les métadonnées que vous souhaitez faire un miroir des commits réalisés dans le dépÎt Git vers le dépÎt SVN original. Si vous ne voulez pas de synchronisation dans votre journal de validation, vous pouvez éliminer le paramÚtre --no-metadata.

Ceci fait ressembler votre commande import à ceci :

$ git-svn clone https://my-project.googlecode.com/svn/ \
      --authors-file=users.txt --no-metadata -s my_project

Maintenant vous devriez avoir un import Subversion plus joli dans votre dossier my_project. Au lieu de commits qui ressemblent Ă  ceci

commit 37efa680e8473b615de980fa935944215428a35a
Author: schacon <schacon@4c93b258-373f-11de-be05-5f7a86268029>
Date:   Sun May 3 00:12:22 2009 +0000

    fixed install - go to trunk

    git-svn-id: https://my-project.googlecode.com/svn/trunk@94 4c93b258-373f-11de-
    be05-5f7a86268029

ils ressemblent Ă  ceci :

commit 03a8785f44c8ea5cdb0e8834b7c8e6c469be2ff2
Author: Scott Chacon <schacon@geemail.com>
Date:   Sun May 3 00:12:22 2009 +0000

    fixed install - go to trunk

Non seulement le champ Auteur a l’air beaucoup mieux, mais le git-svn-id n’est plus là non plus.

Vous devriez aussi faire un peu de mĂ©nage post-import. D’abord, vous devriez nettoyer les rĂ©fĂ©rences bizarres que git svn a installĂ©es. PremiĂšrement vous dĂ©placerez les Ă©tiquettes afin qu’elles soient de vĂ©ritables Ă©tiquettes plutĂŽt que d’étranges branches distantes, et ensuite vous dĂ©placerez le reste des branches afin qu’elles soient locales.

Pour dĂ©placer les Ă©tiquettes pour qu’elles soient des Ă©tiquettes Git propres, lancez

$ for t in $(git for-each-ref --format='%(refname:short)' refs/remotes/tags); do git tag ${t/tags\//} $t && git branch -D -r $t; done

Ceci prend les références qui étaient des branches distantes qui commençaient par remotes/origin/tags et en fait de vraies étiquettes (légÚres).

Ensuite, dĂ©placez le reste des rĂ©fĂ©rences sous refs/remotes pour qu’elles soient des branches locales :

$ for b in $(git for-each-ref --format='%(refname:short)' refs/remotes); do git branch $b refs/remotes/$b && git branch -D -r $b; done

Il peut arriver que vous voyiez quelques autres branches qui sont suffixĂ©es par @xxx (oĂč xxx est un nombre), alors que dans Subversion vous ne voyez qu’une seule branche. C’est en fait une fonctionnalitĂ© Subversion appelĂ©e « peg-revisions », qui est quelque chose pour laquelle Git n’a tout simplement pas d’équivalent syntaxique. Donc, git svn ajoute simplement le numĂ©ro de version svn au nom de la branche de la mĂȘme façon que vous l’auriez Ă©crit dans svn pour adresser la « peg-revision » de cette branche. Si vous ne vous souciez plus des « peg-revisions », supprimez-les simplement en utilisant git branch -d.

$ for p in $(git for-each-ref --format='%(refname:short)' | grep @); do git branch -D $p; done

Maintenant toutes les vieilles branches sont de vraies branches Git et toutes les vieilles Ă©tiquettes sont de vraies Ă©tiquettes Git.

Il y a une derniĂšre chose Ă  nettoyer. Malheureusement, git svn crĂ©e une branche supplĂ©mentaire appelĂ©e trunk, qui correspond Ă  la branche par dĂ©faut de Subversion, mais la ref trunk pointe au mĂȘme endroit que master. Comme master est plus idiomatiquement Git, voici comment supprimer la branche supplĂ©mentaire :

$ git branch -d trunk

La derniùre chose à faire est d’ajouter votre nouveau serveur Git en tant que serveur distant et pousser vers lui. Voici un exemple d’ajout de votre serveur en tant que serveur distant :

$ git remote add origin git@my-git-server:myrepository.git

Puisque vous voulez que vos branches et étiquettes montent, vous pouvez maintenant lancer :

$ git push origin --all
$ git push origin --tags

Toutes vos branches et Ă©tiquettes devraient ĂȘtre sur votre nouveau serveur Git dans un import joli et propre.

Mercurial

Puisque Mercurial et Git ont des modĂšles assez similaires pour reprĂ©senter les versions, et puisque Git est un peu plus flexible, convertir un dĂ©pĂŽt depuis Mercurial vers Git est assez simple, en utilisant un outil appelĂ© "hg-fast-export", duquel vous aurez besoin d’une copie :

$ git clone https://github.com/frej/fast-export.git

La premiĂšre Ă©tape dans la conversion est d’obtenir un clone complet du dĂ©pĂŽt Mercurial que vous voulez convertir :

$ hg clone <remote repo URL> /tmp/hg-repo

L’étape suivante est de crĂ©er un fichier d’association d’auteur. Mercurial est un peu plus indulgent que Git pour ce qu’il mettra dans le champ auteur pour les modifications, donc c’est le bon moment pour faire le mĂ©nage. La gĂ©nĂ©ration de ceci tient en une ligne de commande dans un shell bash :

$ cd /tmp/hg-repo
$ hg log | grep user: | sort | uniq | sed 's/user: *//' > ../authors

Cela prendra quelques secondes, en fonction de la longueur de l’historique de votre projet, et ensuite le fichier /tmp/authors ressemblera à quelque chose comme ceci :

bob
bob@localhost
bob <bob@company.com>
bob jones <bob <AT> company <DOT> com>
Bob Jones <bob@company.com>
Joe Smith <joe@company.com>

Dans cet exemple, la mĂȘme personne (Bob) a crĂ©Ă© des modifications sous diffĂ©rents noms, dont l’un est correct, et dont un autre est complĂštement invalide pour un commit Git. Hg-fast-import nous laisse rĂ©gler cela en transformant chaque ligne en rĂšgle : "<source>"="<cible>", qui transforme une `<source> en <cible>. Dans les chaĂźnes <source> et <cible>, toutes les sĂ©quences d’échappement supportĂ©es par la fonction python string_escape sont prises en charge. Si le fichier de transformation d’auteurs ne contient pas de correspondance avec <source>, cet auteur sera envoyĂ© Ă  Git sans modification. Dans cet exemple, nous voulons que notre fichier ressemble Ă  cela :

bob=Bob Jones <bob@company.com>
bob@localhost=Bob Jones <bob@company.com>
bob jones <bob <AT> company <DOT> com>=Bob Jones <bob@company.com>
bob <bob@company.com>=Bob Jones <bob@company.com>

Le mĂȘme type de fichier de correspondance peut ĂȘtre utilisĂ© pour renommer les branches et les Ă©tiquettes lorsque le nom Mercurial n’est pas permis dans Git.

L’étape suivante consiste Ă  crĂ©er notre nouveau dĂ©pĂŽt Git, et Ă  lancer le script d’export :

$ git init /tmp/converted
$ cd /tmp/converted
$ /tmp/fast-export/hg-fast-export.sh -r /tmp/hg-repo -A /tmp/authors

L’option -r indique Ă  hg-fast-export oĂč trouver le dĂ©pĂŽt Mercurial que l’on veut convertir, et l’option -A lui indique oĂč trouver le fichier de correspondance d’auteur. Le script analyse les modifications Mercurial et les convertit en un script pour la fonctionnalitĂ© "fast-import" de Git (que nous dĂ©taillerons un peu plus tard). Cela prend un peu de temps (bien que ce soit beaucoup plus rapide que si c’était Ă  travers le rĂ©seau), et la sortie est assez verbeuse :

$ /tmp/fast-export/hg-fast-export.sh -r /tmp/hg-repo -A /tmp/authors
Loaded 4 authors
master: Exporting full revision 1/22208 with 13/0/0 added/changed/removed files
master: Exporting simple delta revision 2/22208 with 1/1/0 added/changed/removed files
master: Exporting simple delta revision 3/22208 with 0/1/0 added/changed/removed files
[
]
master: Exporting simple delta revision 22206/22208 with 0/4/0 added/changed/removed files
master: Exporting simple delta revision 22207/22208 with 0/2/0 added/changed/removed files
master: Exporting thorough delta revision 22208/22208 with 3/213/0 added/changed/removed files
Exporting tag [0.4c] at [hg r9] [git :10]
Exporting tag [0.4d] at [hg r16] [git :17]
[
]
Exporting tag [3.1-rc] at [hg r21926] [git :21927]
Exporting tag [3.1] at [hg r21973] [git :21974]
Issued 22315 commands
git-fast-import statistics:
---------------------------------------------------------------------
Alloc'd objects:     120000
Total objects:       115032 (    208171 duplicates                  )
      blobs  :        40504 (    205320 duplicates      26117 deltas of      39602 attempts)
      trees  :        52320 (      2851 duplicates      47467 deltas of      47599 attempts)
      commits:        22208 (         0 duplicates          0 deltas of          0 attempts)
      tags   :            0 (         0 duplicates          0 deltas of          0 attempts)
Total branches:         109 (         2 loads     )
      marks:        1048576 (     22208 unique    )
      atoms:           1952
Memory total:          7860 KiB
       pools:          2235 KiB
     objects:          5625 KiB
---------------------------------------------------------------------
pack_report: getpagesize()            =       4096
pack_report: core.packedGitWindowSize = 1073741824
pack_report: core.packedGitLimit      = 8589934592
pack_report: pack_used_ctr            =      90430
pack_report: pack_mmap_calls          =      46771
pack_report: pack_open_windows        =          1 /          1
pack_report: pack_mapped              =  340852700 /  340852700
---------------------------------------------------------------------

$ git shortlog -sn
   369  Bob Jones
   365  Joe Smith

C’est Ă  peu prĂšs tout ce qu’il y a. Toutes les Ă©tiquettes Mercurial ont Ă©tĂ© converties en Ă©tiquettes Git, et les branches et marques-page Mercurial ont Ă©tĂ© convertis en branches Git. Maintenant vous ĂȘtes prĂȘt Ă  pousser le dĂ©pĂŽt vers son nouveau serveur d’hĂ©bergement :

$ git remote add origin git@my-git-server:myrepository.git
$ git push origin --all

Perforce

Le systùme suivant dont vous allez voir l’importation est Perforce. Ainsi que nous l’avons dit plus haut, il y a deux façons de permettre de faire parler Git et Perforce l’un avec l’autre : git-p4 et Perforce Git Fusion.

Perforce Git Fusion

Git Fusion rend ce processus assez indolore. Configurez les paramĂštres de votre projet, les correspondances utilisateur et les branches en utilisant un fichier de configuration (comme discutĂ© dans ch09-git-and-other-systems#s_p4_git_fusion>>), et clonez le dĂ©pĂŽt. Git Fusion vous laisse avec ce qui ressemble Ă  un dĂ©pĂŽt Git natif, qui est alors prĂȘt Ă  ĂȘtre poussĂ© vers un hĂŽte Git natif si vous le dĂ©sirez. Vous pouvez mĂȘme utiliser Perforce comme hĂŽte Git si vous ça vous plaĂźt.

Git-p4

Git-p4 peut aussi agir comme outil d’import. Comme exemple, nous importerons le projet Jam depuis le DĂ©pĂŽt Public Perforce. Pour dĂ©finir votre client, vous devez exporter la variable d’environnement P4PORT pour pointer vers le dĂ©pĂŽt Perforce :

$ export P4PORT=public.perforce.com:1666
Note

Pour suivre tout le long, vous aurez besoin d’un dĂ©pĂŽt Perforce auquel vous connecter. Nous utiliserons le dĂ©pĂŽt public Ă  public.perforce.com pour nos exemples, mais vous pouvez utiliser n’importe quel dĂ©pĂŽt auquel vous avez accĂšs.

Lancez la commande git p4 clone pour importer le projet Jam depuis le serveur Perforce, en fournissant le chemin vers le dépÎt et le projet dans lequel vous voulez importer le projet :

$ git-p4 clone //guest/perforce_software/jam@all p4import
Importing from //guest/perforce_software/jam@all into p4import
Initialized empty Git repository in /private/tmp/p4import/.git/
Import destination: refs/remotes/p4/master
Importing revision 9957 (100%)

Ce projet particulier a seulement une branche, mais si vous avez des branches configurĂ©es avec des vues de branche (ou juste un ensemble de dossiers), vous pouvez utiliser l’option --detect-branches avec git p4 clone pour importer aussi toutes les branches du projet. Voyez ch09-git-and-other-systems#s_git_p4_branches>> pour plus de dĂ©tails sur ceci.

A ce point, vous avez presque terminé. Si vous allez dans le dossier p4import et lancez git log, vous pouvez voir le travail importé :

$ git log -2
commit e5da1c909e5db3036475419f6379f2c73710c4e6
Author: giles <giles@giles@perforce.com>
Date:   Wed Feb 8 03:13:27 2012 -0800

    Correction to line 355; change </UL> to </OL>.

    [git-p4: depot-paths = "//public/jam/src/": change = 8068]

commit aa21359a0a135dda85c50a7f7cf249e4f7b8fd98
Author: kwirth <kwirth@perforce.com>
Date:   Tue Jul 7 01:35:51 2009 -0800

    Fix spelling error on Jam doc page (cummulative -> cumulative).

    [git-p4: depot-paths = "//public/jam/src/": change = 7304]

Vous pouvez voir que git-p4 a laissĂ© un identifiant dans chaque message de commit. C’est bien de garder cet identifiant-lĂ , au cas oĂč vous auriez besoin de rĂ©fĂ©rencer le numĂ©ro de changement Perforce plus tard. Cependant, si vous souhaitez enlever l’identifiant, c’est maintenant le moment de le faire – avant que vous ne commenciez Ă  travailler sur le nouveau dĂ©pĂŽt. Vous pouvez utiliser git filter-branch pour enlever en masse les chaĂźnes d’identifiant :

$ git filter-branch --msg-filter 'sed -e "/^\[git-p4:/d"'
Rewrite e5da1c909e5db3036475419f6379f2c73710c4e6 (125/125)
Ref 'refs/heads/master' was rewritten

Si vous lancez git log, vous pouvez voir que toutes les sommes de vérification SHA-1 pour les commits ont changé, mais les chaßnes git-p4 ne sont plus dans les messages de commit :

$ git log -2
commit b17341801ed838d97f7800a54a6f9b95750839b7
Author: giles <giles@giles@perforce.com>
Date:   Wed Feb 8 03:13:27 2012 -0800

    Correction to line 355; change </UL> to </OL>.

commit 3e68c2e26cd89cb983eb52c024ecdfba1d6b3fff
Author: kwirth <kwirth@perforce.com>
Date:   Tue Jul 7 01:35:51 2009 -0800

    Fix spelling error on Jam doc page (cummulative -> cumulative).

Votre import est prĂȘt Ă  ĂȘtre poussĂ© vers votre nouveau serveur Git.

Un importateur personnalisé

Si votre systĂšme n’est pas un de ceux ci-dessus, vous devriez chercher un importateur en ligne – des importateurs de qualitĂ© sont disponibles pour plein d’autres systĂšmes, incluant CVS, Clear Case, Visual Source Safe, mĂȘme un dossier d’archives. Si aucun de ces outils ne fonctionne pour vous, vous avez un outil plus obscur, ou alors vous avez besoin d’un procĂ©dĂ© d’importation personnalisĂ©, vous devriez utiliser git fast-import. Cette commande lit des instructions simples depuis l’entrĂ©e standard pour Ă©crire des donnĂ©es Git spĂ©cifiques. Il est bien plus facile de crĂ©er des objets Git de cette façon que de lancer des commandes Git brutes ou que d’essayer d’écrire les objets bruts (voir Les tripes de Git pour plus d’informations). De cette façon, vous pouvez Ă©crire un script d’importation qui lit l’information nĂ©cessaire hors du systĂšme duquel vous importez et qui affiche les instructions directement dans la sortie standard. Vous pouvez alors lancer ce programme et envoyer sa sortie Ă  travers un tube dans git fast-import.

Pour démontrer rapidement, vous écrirez un importateur simple. Supposez que vous travaillez dans current, vous sauvegardez votre projet en copiant occasionnellement le dossier dans un dossier de sauvegarde estampillé de la date back_YYYY_MM_DD, et vous voulez importer cela dans Git. Votre structure de dossier ressemble à ceci :

$ ls /opt/import_from
back_2014_01_02
back_2014_01_04
back_2014_01_14
back_2014_02_03
current

Pour importer un dossier Git, vous devez passer en revue comment Git stocke ses donnĂ©es. Comme vous vous le rappelez, Git est fondamentalement une liste liĂ©e d’objets commit qui pointent sur un instantanĂ© de contenu. Tout ce que vous avez Ă  faire est de dire Ă  fast-import ce que sont les instantanĂ©s de contenu, quelles donnĂ©es de commit pointent sur eux, et l’ordre dans lequel ils vont. Votre stratĂ©gie sera d’explorer les instantanĂ©s un Ă  un et crĂ©er les commits avec les contenus dans chaque dossier, en liant chaque commit avec le prĂ©cĂ©dent.

Comme nous l’avons fait dans Exemple de politique gĂ©rĂ©e par Git, nous Ă©crirons ceci en Ruby, parce que c’est ce avec quoi nous travaillons gĂ©nĂ©ralement et ça a tendance Ă  ĂȘtre facile Ă  lire. Vous pouvez Ă©crire cet exemple assez facilement avec n’importe quel langage de programmation auquel vous ĂȘtes familier – il faut seulement afficher l’information appropriĂ©e dans stdout. Et, si vous travaillez sous Windows, cela signifie que vous devrez prendre un soin particulier Ă  ne pas introduire de retour chariot (carriage return, CR) Ă  la fin de vos lignes – git fast-import est trĂšs exigeant ; il accepte seulement la fin de ligne (Line Feed, LF) et pas le retour chariot fin de ligne (CRLF) que Windows utilise.

Pour commencer, vous vous placerez dans le dossier cible et identifierez chaque sous-dossier, chacun Ă©tant un instantanĂ© que vous voulez importer en tant que commit. Vous vous placerez dans chaque sous-dossier et afficherez les commandes nĂ©cessaires pour l’exporter. Votre boucle basique principale ressemble Ă  ceci :

last_mark = nil

# boucle sur les dossiers
Dir.chdir(ARGV[0]) do
  Dir.glob("*").each do |dir|
    next if File.file?(dir)

    # rentre dans chaque dossier cible
    Dir.chdir(dir) do
      last_mark = print_export(dir, last_mark)
    end
  end
end

Vous lancez print_export Ă  l’intĂ©rieur de chaque dossier, qui prend le manifeste et la marque de l’instantanĂ© prĂ©cĂ©dent et retourne la marque et l’empreinte de celui-ci ; de cette façon, vous pouvez les lier proprement. `Marque'' est le terme de `fast-import pour un identifiant que vous donnez Ă  un commit ; au fur et Ă  mesure que vous crĂ©ez des commits, vous donnez Ă  chacun une marque que vous pouvez utiliser pour le lier aux autres commits. Donc, la premiĂšre chose Ă  faire dans votre mĂ©thode print_export est de gĂ©nĂ©rer une marque Ă  partir du nom du dossier :

mark = convert_dir_to_mark(dir)

Vous ferez ceci en crĂ©ant un tableau de dossiers et en utilisant la valeur d’index comme marque, car une marque doit ĂȘtre un nombre entier. Votre mĂ©thode ressemble Ă  ceci :

$marks = []
def convert_dir_to_mark(dir)
  if !$marks.include?(dir)
    $marks << dir
  end
  ($marks.index(dir) + 1).to_s
end

Maintenant que vous avez une reprĂ©sentation par un entier de votre commit, vous avez besoin d’une date pour les mĂ©tadonnĂ©es du commit. Puisque la date est exprimĂ©e dans le nom du dossier, vous l’analyserez. La ligne suivante dans votre fichier print_export est

date = convert_dir_to_date(dir)

oĂč convert_dir_to_date est dĂ©finie comme

def convert_dir_to_date(dir)
  if dir == 'current'
    return Time.now().to_i
  else
    dir = dir.gsub('back_', '')
    (year, month, day) = dir.split('_')
    return Time.local(year, month, day).to_i
  end
end

Cela retourne une valeur entiĂšre pour la date de chaque dossier. Le dernier bout de mĂ©ta-information dont vous avez besoin pour chaque commit est la donnĂ©e de l’auteur, que vous codez en dur dans une variable globale :

$author = 'John Doe <john@example.com>'

Maintenant vous ĂȘtes prĂȘt Ă  commencer Ă  publier l’information de commit pour votre importateur. L’information initiale dĂ©clare que vous ĂȘtes en train de dĂ©finir un objet commit et sur quelle branche il est, suivi de la marque que vous avez gĂ©nĂ©rĂ©e, l’information d’auteur et le message de commit, et ensuite le prĂ©cĂ©dent commit, s’il y en a un. Le code ressemble Ă  ceci :

# affiche l'information d'import
puts 'commit refs/heads/master'
puts 'mark :' + mark
puts "committer #{$author} #{date} -0700"
export_data('imported from ' + dir)
puts 'from :' + last_mark if last_mark

Vous codez en dur le fuseau horaire (-0700) parce que c’est facile de faire ainsi. Si vous importez depuis un autre systĂšme, vous devez spĂ©cifier le fuseau horaire comme dĂ©calage. Le message de commit doit ĂȘtre exprimĂ© dans un format spĂ©cial :

data (taille)\n(contenu)

Le format est constituĂ© du mot data, de la taille de la donnĂ©e Ă  lire, d’une nouvelle ligne et finalement de la donnĂ©e. Comme vous avez besoin d’utiliser le mĂȘme format pour spĂ©cifier le contenu du fichier plus tard, vous crĂ©ez une mĂ©thode assistante, export_data :

def export_data(string)
  print "data #{string.size}\n#{string}"
end

Tout ce qui reste Ă  faire est de spĂ©cifier le contenu du fichier pour chaque instantanĂ©. C’est facile, car vous les avez dans un dossier – vous pouvez imprimer la commande deleteall suivie par le contenu de chaque fichier du dossier. Git enregistrera ensuite chaque instantanĂ© de maniĂšre appropriĂ©e :

puts 'deleteall'
Dir.glob("**/*").each do |file|
  next if !File.file?(file)
  inline_data(file)
end

Note : Comme beaucoup de systĂšmes conçoivent leurs rĂ©visions comme des changements d’un commit Ă  l’autre, fast-import peut aussi prendre des commandes avec chaque commit pour spĂ©cifier quels fichiers ont Ă©tĂ© ajoutĂ©s, supprimĂ©s ou modifiĂ©s et ce qu’est le nouveau contenu. Vous pourriez calculer les diffĂ©rences entre instantanĂ©s et fournir seulement cette donnĂ©e, mais faire ainsi est plus complexe – vous pouvez aussi bien donner Ă  Git toutes les donnĂ©es et le laisser faire. Si cela convient mieux pour vos donnĂ©es, rĂ©fĂ©rez-vous Ă  la page de manuel fast-import pour les dĂ©tails sur la maniĂšre de fournir les donnĂ©es de cette façon.

Le format pour lister le contenu d’un nouveau fichier ou pour spĂ©cifier un fichier modifiĂ© avec le nouveau contenu est le suivant :

M 644 inline path/to/file
data (taille)
(contenu du fichier)

Ici, 644 est le mode (si vous avez des fichiers exécutables, vous devez le détecter et spécifier 755 à la place), et inline dit que vous listerez le contenu immédiatement aprÚs cette ligne. Votre méthode inline_data ressemble à ceci :

def inline_data(file, code = 'M', mode = '644')
  content = File.read(file)
  puts "#{code} #{mode} inline #{file}"
  export_data(content)
end

Vous rĂ©utilisez la mĂ©thode export_data que vous avez dĂ©finie plus tĂŽt, parce que c’est de la mĂȘme façon que vous avez spĂ©cifiĂ© vos donnĂ©es du message de commit.

La derniĂšre chose que vous avez besoin de faire est de retourner la marque courante pour qu’elle soit passĂ©e Ă  la prochaine itĂ©ration :

return mark
Note

Si vous ĂȘtes sous Windows, vous devrez vous assurer d’ajouter une Ă©tape supplĂ©mentaire. Comme mentionnĂ© prĂ©cĂ©demment, Windows utilise CRLF comme caractĂšres de fin de ligne alors que git fast-import ne s’attend qu’à LF. Pour contourner ce problĂšme et satisfaire git fast-import, vous devez indiquer Ă  Ruby d’utiliser LF au lieu de CRLF :

$stdout.binmode

Et voilà. Voici le script dans son intégralité :

#!/usr/bin/env ruby

$stdout.binmode
$author = "John Doe <john@example.com>"

$marks = []
def convert_dir_to_mark(dir)
    if !$marks.include?(dir)
        $marks << dir
    end
    ($marks.index(dir)+1).to_s
end


def convert_dir_to_date(dir)
    if dir == 'current'
        return Time.now().to_i
    else
        dir = dir.gsub('back_', '')
        (year, month, day) = dir.split('_')
        return Time.local(year, month, day).to_i
    end
end

def export_data(string)
    print "data #{string.size}\n#{string}"
end

def inline_data(file, code='M', mode='644')
    content = File.read(file)
    puts "#{code} #{mode} inline #{file}"
    export_data(content)
end

def print_export(dir, last_mark)
    date = convert_dir_to_date(dir)
    mark = convert_dir_to_mark(dir)

    puts 'commit refs/heads/master'
    puts "mark :#{mark}"
    puts "committer #{$author} #{date} -0700"
    export_data("imported from #{dir}")
    puts "from :#{last_mark}" if last_mark

    puts 'deleteall'
    Dir.glob("**/*").each do |file|
        next if !File.file?(file)
        inline_data(file)
    end
    mark
end


# explore les dossiers
last_mark = nil
Dir.chdir(ARGV[0]) do
    Dir.glob("*").each do |dir|
        next if File.file?(dir)

        # move into the target directory
        Dir.chdir(dir) do
            last_mark = print_export(dir, last_mark)
        end
    end
end

Si vous lancez ce script, vous obtiendrez un contenu qui ressemble à peu prÚs à ceci :

$ ruby import.rb /opt/import_from
commit refs/heads/master
mark :1
committer John Doe <john@example.com> 1388649600 -0700
data 29
imported from back_2014_01_02deleteall
M 644 inline README.md
data 28
# Hello

This is my readme.
commit refs/heads/master
mark :2
committer John Doe <john@example.com> 1388822400 -0700
data 29
imported from back_2014_01_04from :1
deleteall
M 644 inline main.rb
data 34
#!/bin/env ruby

puts "Hey there"
M 644 inline README.md
(...)

Pour lancer l’importateur, envoyez Ă  travers un tube cette sortie Ă  git fast-import pendant que vous ĂȘtes dans le dossier Git dans lequel vous voulez importer. Vous pouvez crĂ©er un nouveau dossier et ensuite exĂ©cuter git init Ă  l’intĂ©rieur de celui-ci comme point de dĂ©part, et ensuite exĂ©cuter votre script :

$ git init
Initialized empty Git repository in /opt/import_to/.git/
$ ruby import.rb /opt/import_from | git fast-import
git-fast-import statistics:
---------------------------------------------------------------------
Alloc'd objects:       5000
Total objects:           13 (         6 duplicates                  )
      blobs  :            5 (         4 duplicates          3 deltas of          5 attempts)
      trees  :            4 (         1 duplicates          0 deltas of          4 attempts)
      commits:            4 (         1 duplicates          0 deltas of          0 attempts)
      tags   :            0 (         0 duplicates          0 deltas of          0 attempts)
Total branches:           1 (         1 loads     )
      marks:           1024 (         5 unique    )
      atoms:              2
Memory total:          2344 KiB
       pools:          2110 KiB
     objects:           234 KiB
---------------------------------------------------------------------
pack_report: getpagesize()            =       4096
pack_report: core.packedGitWindowSize = 1073741824
pack_report: core.packedGitLimit      = 8589934592
pack_report: pack_used_ctr            =         10
pack_report: pack_mmap_calls          =          5
pack_report: pack_open_windows        =          2 /          2
pack_report: pack_mapped              =       1457 /       1457
---------------------------------------------------------------------

Comme vous pouvez le voir, lorsque c’est terminĂ© avec succĂšs, il vous donne un lot de statistiques sur ce qu’il a fait. Dans ce cas-ci, vous avez importĂ© un total de 13 objets pour 4 commits dans une branche. Maintenant, vous pouvez lancer git log pour voir votre nouvel historique :

$ git log -2
commit 3caa046d4aac682a55867132ccdfbe0d3fdee498
Author: John Doe <john@example.com>
Date:   Tue Jul 29 19:39:04 2014 -0700

    imported from current

commit 4afc2b945d0d3c8cd00556fbe2e8224569dc9def
Author: John Doe <john@example.com>
Date:   Mon Feb 3 01:00:00 2014 -0700

    imported from back_2014_02_03

Vous y voilà — un dĂ©pĂŽt Git beau et propre. Il est important de noter que rien n’est extrait – vous n’avez d’abord aucun fichier dans votre rĂ©pertoire de travail. Pour les obtenir, vous devez rĂ©initialiser votre branche lĂ  oĂč master est maintenant :

$ ls
$ git reset --hard master
HEAD is now at 3caa046 imported from current
$ ls
README.md main.rb

Vous pouvez faire beaucoup plus avec l’outil fast-import – manipuler diffĂ©rents modes, les donnĂ©es binaires, les branches multiples et la fusion, les Ă©tiquettes, les indicateurs de progression, et plus encore. Nombre d’exemples de scĂ©narios plus complexes sont disponibles dans le dossier contrib/fast-import du code source Git.

scroll-to-top