Code

Merge branch 'jc/delta' into next
[git.git] / git-cvsserver.perl
1 #!/usr/bin/perl
3 ####
4 #### This application is a CVS emulation layer for git.
5 #### It is intended for clients to connect over SSH.
6 #### See the documentation for more details.
7 ####
8 #### Copyright The Open University UK - 2006.
9 ####
10 #### Authors: Martyn Smith    <martyn@catalyst.net.nz>
11 ####          Martin Langhoff <martin@catalyst.net.nz>
12 ####
13 ####
14 #### Released under the GNU Public License, version 2.
15 ####
16 ####
18 use strict;
19 use warnings;
21 use Fcntl;
22 use File::Temp qw/tempdir tempfile/;
23 use File::Basename;
25 my $log = GITCVS::log->new();
26 my $cfg;
28 my $DATE_LIST = {
29     Jan => "01",
30     Feb => "02",
31     Mar => "03",
32     Apr => "04",
33     May => "05",
34     Jun => "06",
35     Jul => "07",
36     Aug => "08",
37     Sep => "09",
38     Oct => "10",
39     Nov => "11",
40     Dec => "12",
41 };
43 # Enable autoflush for STDOUT (otherwise the whole thing falls apart)
44 $| = 1;
46 #### Definition and mappings of functions ####
48 my $methods = {
49     'Root'            => \&req_Root,
50     'Valid-responses' => \&req_Validresponses,
51     'valid-requests'  => \&req_validrequests,
52     'Directory'       => \&req_Directory,
53     'Entry'           => \&req_Entry,
54     'Modified'        => \&req_Modified,
55     'Unchanged'       => \&req_Unchanged,
56     'Questionable'    => \&req_Questionable,
57     'Argument'        => \&req_Argument,
58     'Argumentx'       => \&req_Argument,
59     'expand-modules'  => \&req_expandmodules,
60     'add'             => \&req_add,
61     'remove'          => \&req_remove,
62     'co'              => \&req_co,
63     'update'          => \&req_update,
64     'ci'              => \&req_ci,
65     'diff'            => \&req_diff,
66     'log'             => \&req_log,
67     'rlog'            => \&req_log,
68     'tag'             => \&req_CATCHALL,
69     'status'          => \&req_status,
70     'admin'           => \&req_CATCHALL,
71     'history'         => \&req_CATCHALL,
72     'watchers'        => \&req_CATCHALL,
73     'editors'         => \&req_CATCHALL,
74     'annotate'        => \&req_annotate,
75     'Global_option'   => \&req_Globaloption,
76     #'annotate'        => \&req_CATCHALL,
77 };
79 ##############################################
82 # $state holds all the bits of information the clients sends us that could
83 # potentially be useful when it comes to actually _doing_ something.
84 my $state = {};
85 $log->info("--------------- STARTING -----------------");
87 my $TEMP_DIR = tempdir( CLEANUP => 1 );
88 $log->debug("Temporary directory is '$TEMP_DIR'");
90 # Keep going until the client closes the connection
91 while (<STDIN>)
92 {
93     chomp;
95     # Check to see if we've seen this method, and call appropiate function.
96     if ( /^([\w-]+)(?:\s+(.*))?$/ and defined($methods->{$1}) )
97     {
98         # use the $methods hash to call the appropriate sub for this command
99         #$log->info("Method : $1");
100         &{$methods->{$1}}($1,$2);
101     } else {
102         # log fatal because we don't understand this function. If this happens
103         # we're fairly screwed because we don't know if the client is expecting
104         # a response. If it is, the client will hang, we'll hang, and the whole
105         # thing will be custard.
106         $log->fatal("Don't understand command $_\n");
107         die("Unknown command $_");
108     }
111 $log->debug("Processing time : user=" . (times)[0] . " system=" . (times)[1]);
112 $log->info("--------------- FINISH -----------------");
114 # Magic catchall method.
115 #    This is the method that will handle all commands we haven't yet
116 #    implemented. It simply sends a warning to the log file indicating a
117 #    command that hasn't been implemented has been invoked.
118 sub req_CATCHALL
120     my ( $cmd, $data ) = @_;
121     $log->warn("Unhandled command : req_$cmd : $data");
125 # Root pathname \n
126 #     Response expected: no. Tell the server which CVSROOT to use. Note that
127 #     pathname is a local directory and not a fully qualified CVSROOT variable.
128 #     pathname must already exist; if creating a new root, use the init
129 #     request, not Root. pathname does not include the hostname of the server,
130 #     how to access the server, etc.; by the time the CVS protocol is in use,
131 #     connection, authentication, etc., are already taken care of. The Root
132 #     request must be sent only once, and it must be sent before any requests
133 #     other than Valid-responses, valid-requests, UseUnchanged, Set or init.
134 sub req_Root
136     my ( $cmd, $data ) = @_;
137     $log->debug("req_Root : $data");
139     $state->{CVSROOT} = $data;
141     $ENV{GIT_DIR} = $state->{CVSROOT} . "/";
143     foreach my $line ( `git-var -l` )
144     {
145         next unless ( $line =~ /^(.*?)\.(.*?)=(.*)$/ );
146         $cfg->{$1}{$2} = $3;
147     }
149     unless ( defined ( $cfg->{gitcvs}{enabled} ) and $cfg->{gitcvs}{enabled} =~ /^\s*(1|true|yes)\s*$/i )
150     {
151         print "E GITCVS emulation needs to be enabled on this repo\n";
152         print "E the repo config file needs a [gitcvs] section added, and the parameter 'enabled' set to 1\n";
153         print "E \n";
154         print "error 1 GITCVS emulation disabled\n";
155     }
157     if ( defined ( $cfg->{gitcvs}{logfile} ) )
158     {
159         $log->setfile($cfg->{gitcvs}{logfile});
160     } else {
161         $log->nofile();
162     }
165 # Global_option option \n
166 #     Response expected: no. Transmit one of the global options `-q', `-Q',
167 #     `-l', `-t', `-r', or `-n'. option must be one of those strings, no
168 #     variations (such as combining of options) are allowed. For graceful
169 #     handling of valid-requests, it is probably better to make new global
170 #     options separate requests, rather than trying to add them to this
171 #     request.
172 sub req_Globaloption
174     my ( $cmd, $data ) = @_;
175     $log->debug("req_Globaloption : $data");
177     # TODO : is this data useful ???
180 # Valid-responses request-list \n
181 #     Response expected: no. Tell the server what responses the client will
182 #     accept. request-list is a space separated list of tokens.
183 sub req_Validresponses
185     my ( $cmd, $data ) = @_;
186     $log->debug("req_Validrepsonses : $data");
188     # TODO : re-enable this, currently it's not particularly useful
189     #$state->{validresponses} = [ split /\s+/, $data ];
192 # valid-requests \n
193 #     Response expected: yes. Ask the server to send back a Valid-requests
194 #     response.
195 sub req_validrequests
197     my ( $cmd, $data ) = @_;
199     $log->debug("req_validrequests");
201     $log->debug("SEND : Valid-requests " . join(" ",keys %$methods));
202     $log->debug("SEND : ok");
204     print "Valid-requests " . join(" ",keys %$methods) . "\n";
205     print "ok\n";
208 # Directory local-directory \n
209 #     Additional data: repository \n. Response expected: no. Tell the server
210 #     what directory to use. The repository should be a directory name from a
211 #     previous server response. Note that this both gives a default for Entry
212 #     and Modified and also for ci and the other commands; normal usage is to
213 #     send Directory for each directory in which there will be an Entry or
214 #     Modified, and then a final Directory for the original directory, then the
215 #     command. The local-directory is relative to the top level at which the
216 #     command is occurring (i.e. the last Directory which is sent before the
217 #     command); to indicate that top level, `.' should be sent for
218 #     local-directory.
219 sub req_Directory
221     my ( $cmd, $data ) = @_;
223     my $repository = <STDIN>;
224     chomp $repository;
227     $state->{localdir} = $data;
228     $state->{repository} = $repository;
229     $state->{directory} = $repository;
230     $state->{directory} =~ s/^$state->{CVSROOT}\///;
231     $state->{module} = $1 if ($state->{directory} =~ s/^(.*?)(\/|$)//);
232     $state->{directory} .= "/" if ( $state->{directory} =~ /\S/ );
234     $log->debug("req_Directory : localdir=$data repository=$repository directory=$state->{directory} module=$state->{module}");
237 # Entry entry-line \n
238 #     Response expected: no. Tell the server what version of a file is on the
239 #     local machine. The name in entry-line is a name relative to the directory
240 #     most recently specified with Directory. If the user is operating on only
241 #     some files in a directory, Entry requests for only those files need be
242 #     included. If an Entry request is sent without Modified, Is-modified, or
243 #     Unchanged, it means the file is lost (does not exist in the working
244 #     directory). If both Entry and one of Modified, Is-modified, or Unchanged
245 #     are sent for the same file, Entry must be sent first. For a given file,
246 #     one can send Modified, Is-modified, or Unchanged, but not more than one
247 #     of these three.
248 sub req_Entry
250     my ( $cmd, $data ) = @_;
252     $log->debug("req_Entry : $data");
254     my @data = split(/\//, $data);
256     $state->{entries}{$state->{directory}.$data[1]} = {
257         revision    => $data[2],
258         conflict    => $data[3],
259         options     => $data[4],
260         tag_or_date => $data[5],
261     };
264 # add \n
265 #     Response expected: yes. Add a file or directory. This uses any previous
266 #     Argument, Directory, Entry, or Modified requests, if they have been sent.
267 #     The last Directory sent specifies the working directory at the time of
268 #     the operation. To add a directory, send the directory to be added using
269 #     Directory and Argument requests.
270 sub req_add
272     my ( $cmd, $data ) = @_;
274     argsplit("add");
276     my $addcount = 0;
278     foreach my $filename ( @{$state->{args}} )
279     {
280         $filename = filecleanup($filename);
282         unless ( defined ( $state->{entries}{$filename}{modified_filename} ) )
283         {
284             print "E cvs add: nothing known about `$filename'\n";
285             next;
286         }
287         # TODO : check we're not squashing an already existing file
288         if ( defined ( $state->{entries}{$filename}{revision} ) )
289         {
290             print "E cvs add: `$filename' has already been entered\n";
291             next;
292         }
295         my ( $filepart, $dirpart ) = filenamesplit($filename);
297         print "E cvs add: scheduling file `$filename' for addition\n";
299         print "Checked-in $dirpart\n";
300         print "$filename\n";
301         print "/$filepart/0///\n";
303         $addcount++;
304     }
306     if ( $addcount == 1 )
307     {
308         print "E cvs add: use `cvs commit' to add this file permanently\n";
309     }
310     elsif ( $addcount > 1 )
311     {
312         print "E cvs add: use `cvs commit' to add these files permanently\n";
313     }
315     print "ok\n";
318 # remove \n
319 #     Response expected: yes. Remove a file. This uses any previous Argument,
320 #     Directory, Entry, or Modified requests, if they have been sent. The last
321 #     Directory sent specifies the working directory at the time of the
322 #     operation. Note that this request does not actually do anything to the
323 #     repository; the only effect of a successful remove request is to supply
324 #     the client with a new entries line containing `-' to indicate a removed
325 #     file. In fact, the client probably could perform this operation without
326 #     contacting the server, although using remove may cause the server to
327 #     perform a few more checks. The client sends a subsequent ci request to
328 #     actually record the removal in the repository.
329 sub req_remove
331     my ( $cmd, $data ) = @_;
333     argsplit("remove");
335     # Grab a handle to the SQLite db and do any necessary updates
336     my $updater = GITCVS::updater->new($state->{CVSROOT}, $state->{module}, $log);
337     $updater->update();
339     #$log->debug("add state : " . Dumper($state));
341     my $rmcount = 0;
343     foreach my $filename ( @{$state->{args}} )
344     {
345         $filename = filecleanup($filename);
347         if ( defined ( $state->{entries}{$filename}{unchanged} ) or defined ( $state->{entries}{$filename}{modified_filename} ) )
348         {
349             print "E cvs remove: file `$filename' still in working directory\n";
350             next;
351         }
353         my $meta = $updater->getmeta($filename);
354         my $wrev = revparse($filename);
356         unless ( defined ( $wrev ) )
357         {
358             print "E cvs remove: nothing known about `$filename'\n";
359             next;
360         }
362         if ( defined($wrev) and $wrev < 0 )
363         {
364             print "E cvs remove: file `$filename' already scheduled for removal\n";
365             next;
366         }
368         unless ( $wrev == $meta->{revision} )
369         {
370             # TODO : not sure if the format of this message is quite correct.
371             print "E cvs remove: Up to date check failed for `$filename'\n";
372             next;
373         }
376         my ( $filepart, $dirpart ) = filenamesplit($filename);
378         print "E cvs remove: scheduling `$filename' for removal\n";
380         print "Checked-in $dirpart\n";
381         print "$filename\n";
382         print "/$filepart/-1.$wrev///\n";
384         $rmcount++;
385     }
387     if ( $rmcount == 1 )
388     {
389         print "E cvs remove: use `cvs commit' to remove this file permanently\n";
390     }
391     elsif ( $rmcount > 1 )
392     {
393         print "E cvs remove: use `cvs commit' to remove these files permanently\n";
394     }
396     print "ok\n";
399 # Modified filename \n
400 #     Response expected: no. Additional data: mode, \n, file transmission. Send
401 #     the server a copy of one locally modified file. filename is a file within
402 #     the most recent directory sent with Directory; it must not contain `/'.
403 #     If the user is operating on only some files in a directory, only those
404 #     files need to be included. This can also be sent without Entry, if there
405 #     is no entry for the file.
406 sub req_Modified
408     my ( $cmd, $data ) = @_;
410     my $mode = <STDIN>;
411     chomp $mode;
412     my $size = <STDIN>;
413     chomp $size;
415     # Grab config information
416     my $blocksize = 8192;
417     my $bytesleft = $size;
418     my $tmp;
420     # Get a filehandle/name to write it to
421     my ( $fh, $filename ) = tempfile( DIR => $TEMP_DIR );
423     # Loop over file data writing out to temporary file.
424     while ( $bytesleft )
425     {
426         $blocksize = $bytesleft if ( $bytesleft < $blocksize );
427         read STDIN, $tmp, $blocksize;
428         print $fh $tmp;
429         $bytesleft -= $blocksize;
430     }
432     close $fh;
434     # Ensure we have something sensible for the file mode
435     if ( $mode =~ /u=(\w+)/ )
436     {
437         $mode = $1;
438     } else {
439         $mode = "rw";
440     }
442     # Save the file data in $state
443     $state->{entries}{$state->{directory}.$data}{modified_filename} = $filename;
444     $state->{entries}{$state->{directory}.$data}{modified_mode} = $mode;
445     $state->{entries}{$state->{directory}.$data}{modified_hash} = `git-hash-object $filename`;
446     $state->{entries}{$state->{directory}.$data}{modified_hash} =~ s/\s.*$//s;
448     #$log->debug("req_Modified : file=$data mode=$mode size=$size");
451 # Unchanged filename \n
452 #     Response expected: no. Tell the server that filename has not been
453 #     modified in the checked out directory. The filename is a file within the
454 #     most recent directory sent with Directory; it must not contain `/'.
455 sub req_Unchanged
457     my ( $cmd, $data ) = @_;
459     $state->{entries}{$state->{directory}.$data}{unchanged} = 1;
461     #$log->debug("req_Unchanged : $data");
464 # Questionable filename \n
465 #     Response expected: no. Additional data: no.
466 #     Tell the server to check whether filename should be ignored,
467 #     and if not, next time the server sends responses, send (in
468 #     a M response) `?' followed by the directory and filename.
469 #     filename must not contain `/'; it needs to be a file in the
470 #     directory named by the most recent Directory request.
471 sub req_Questionable
473     my ( $cmd, $data ) = @_;
475     $state->{entries}{$state->{directory}.$data}{questionable} = 1;
477     #$log->debug("req_Questionable : $data");
480 # Argument text \n
481 #     Response expected: no. Save argument for use in a subsequent command.
482 #     Arguments accumulate until an argument-using command is given, at which
483 #     point they are forgotten.
484 # Argumentx text \n
485 #     Response expected: no. Append \n followed by text to the current argument
486 #     being saved.
487 sub req_Argument
489     my ( $cmd, $data ) = @_;
491     # TODO :  Not quite sure how Argument and Argumentx differ, but I assume
492     # it's for multi-line arguments ... somehow ...
494     $log->debug("$cmd : $data");
496     push @{$state->{arguments}}, $data;
499 # expand-modules \n
500 #     Response expected: yes. Expand the modules which are specified in the
501 #     arguments. Returns the data in Module-expansion responses. Note that the
502 #     server can assume that this is checkout or export, not rtag or rdiff; the
503 #     latter do not access the working directory and thus have no need to
504 #     expand modules on the client side. Expand may not be the best word for
505 #     what this request does. It does not necessarily tell you all the files
506 #     contained in a module, for example. Basically it is a way of telling you
507 #     which working directories the server needs to know about in order to
508 #     handle a checkout of the specified modules. For example, suppose that the
509 #     server has a module defined by
510 #   aliasmodule -a 1dir
511 #     That is, one can check out aliasmodule and it will take 1dir in the
512 #     repository and check it out to 1dir in the working directory. Now suppose
513 #     the client already has this module checked out and is planning on using
514 #     the co request to update it. Without using expand-modules, the client
515 #     would have two bad choices: it could either send information about all
516 #     working directories under the current directory, which could be
517 #     unnecessarily slow, or it could be ignorant of the fact that aliasmodule
518 #     stands for 1dir, and neglect to send information for 1dir, which would
519 #     lead to incorrect operation. With expand-modules, the client would first
520 #     ask for the module to be expanded:
521 sub req_expandmodules
523     my ( $cmd, $data ) = @_;
525     argsplit();
527     $log->debug("req_expandmodules : " . ( defined($data) ? $data : "[NULL]" ) );
529     unless ( ref $state->{arguments} eq "ARRAY" )
530     {
531         print "ok\n";
532         return;
533     }
535     foreach my $module ( @{$state->{arguments}} )
536     {
537         $log->debug("SEND : Module-expansion $module");
538         print "Module-expansion $module\n";
539     }
541     print "ok\n";
542     statecleanup();
545 # co \n
546 #     Response expected: yes. Get files from the repository. This uses any
547 #     previous Argument, Directory, Entry, or Modified requests, if they have
548 #     been sent. Arguments to this command are module names; the client cannot
549 #     know what directories they correspond to except by (1) just sending the
550 #     co request, and then seeing what directory names the server sends back in
551 #     its responses, and (2) the expand-modules request.
552 sub req_co
554     my ( $cmd, $data ) = @_;
556     argsplit("co");
558     my $module = $state->{args}[0];
559     my $checkout_path = $module;
561     # use the user specified directory if we're given it
562     $checkout_path = $state->{opt}{d} if ( exists ( $state->{opt}{d} ) );
564     $log->debug("req_co : " . ( defined($data) ? $data : "[NULL]" ) );
566     $log->info("Checking out module '$module' ($state->{CVSROOT}) to '$checkout_path'");
568     $ENV{GIT_DIR} = $state->{CVSROOT} . "/";
570     # Grab a handle to the SQLite db and do any necessary updates
571     my $updater = GITCVS::updater->new($state->{CVSROOT}, $module, $log);
572     $updater->update();
574     $checkout_path =~ s|/$||; # get rid of trailing slashes
576     # Eclipse seems to need the Clear-sticky command
577     # to prepare the 'Entries' file for the new directory.
578     print "Clear-sticky $checkout_path/\n";
579     print $state->{CVSROOT} . "/$checkout_path/\n";
580     print "Clear-static-directory $checkout_path/\n";
581     print $state->{CVSROOT} . "/$checkout_path/\n";
583     # instruct the client that we're checking out to $checkout_path
584     print "E cvs checkout: Updating $checkout_path\n";
586     my %seendirs = ();
588     foreach my $git ( @{$updater->gethead} )
589     {
590         # Don't want to check out deleted files
591         next if ( $git->{filehash} eq "deleted" );
593         ( $git->{name}, $git->{dir} ) = filenamesplit($git->{name});
595         # modification time of this file
596         print "Mod-time $git->{modified}\n";
598         # print some information to the client
599         if ( defined ( $git->{dir} ) and $git->{dir} ne "./" )
600         {
601             print "M U $checkout_path/$git->{dir}$git->{name}\n";
602         } else {
603             print "M U $checkout_path/$git->{name}\n";
604         }
606         if (length($git->{dir}) && $git->{dir} ne './' && !exists($seendirs{$git->{dir}})) {
608             # Eclipse seems to need the Clear-sticky command
609             # to prepare the 'Entries' file for the new directory.
610             print "Clear-sticky $module/$git->{dir}\n";
611             print $state->{CVSROOT} . "/$module/$git->{dir}\n";
612             print "Clear-static-directory $module/$git->{dir}\n";
613             print $state->{CVSROOT} . "/$module/$git->{dir}\n";
614             print "E cvs checkout: Updating /$module/$git->{dir}\n";
615             $seendirs{$git->{dir}} = 1;
616         }
618         # instruct client we're sending a file to put in this path
619         print "Created $checkout_path/" . ( defined ( $git->{dir} ) and $git->{dir} ne "./" ? $git->{dir} . "/" : "" ) . "\n";
621         print $state->{CVSROOT} . "/$module/" . ( defined ( $git->{dir} ) and $git->{dir} ne "./" ? $git->{dir} . "/" : "" ) . "$git->{name}\n";
623         # this is an "entries" line
624         print "/$git->{name}/1.$git->{revision}///\n";
625         # permissions
626         print "u=$git->{mode},g=$git->{mode},o=$git->{mode}\n";
628         # transmit file
629         transmitfile($git->{filehash});
630     }
632     print "ok\n";
634     statecleanup();
637 # update \n
638 #     Response expected: yes. Actually do a cvs update command. This uses any
639 #     previous Argument, Directory, Entry, or Modified requests, if they have
640 #     been sent. The last Directory sent specifies the working directory at the
641 #     time of the operation. The -I option is not used--files which the client
642 #     can decide whether to ignore are not mentioned and the client sends the
643 #     Questionable request for others.
644 sub req_update
646     my ( $cmd, $data ) = @_;
648     $log->debug("req_update : " . ( defined($data) ? $data : "[NULL]" ));
650     argsplit("update");
652     #
653     # It may just be a client exploring the available heads/modukles
654     # in that case, list them as top level directories and leave it
655     # at that. Eclipse uses this technique to offer you a list of
656     # projects (heads in this case) to checkout.
657     #
658     if ($state->{module} eq '') {
659         print "E cvs update: Updating .\n";
660         opendir HEADS, $state->{CVSROOT} . '/refs/heads';
661         while (my $head = readdir(HEADS)) {
662             if (-f $state->{CVSROOT} . '/refs/heads/' . $head) {
663                 print "E cvs update: New directory `$head'\n";
664             }
665         }
666         closedir HEADS;
667         print "ok\n";
668         return 1;
669     }
672     # Grab a handle to the SQLite db and do any necessary updates
673     my $updater = GITCVS::updater->new($state->{CVSROOT}, $state->{module}, $log);
675     $updater->update();
677     # if no files were specified, we need to work out what files we should be providing status on ...
678     argsfromdir($updater) if ( scalar ( @{$state->{args}} ) == 0 );
680     #$log->debug("update state : " . Dumper($state));
682     # foreach file specified on the commandline ...
683     foreach my $filename ( @{$state->{args}} )
684     {
685         $filename = filecleanup($filename);
687         # if we have a -C we should pretend we never saw modified stuff
688         if ( exists ( $state->{opt}{C} ) )
689         {
690             delete $state->{entries}{$filename}{modified_hash};
691             delete $state->{entries}{$filename}{modified_filename};
692             $state->{entries}{$filename}{unchanged} = 1;
693         }
695         my $meta;
696         if ( defined($state->{opt}{r}) and $state->{opt}{r} =~ /^1\.(\d+)/ )
697         {
698             $meta = $updater->getmeta($filename, $1);
699         } else {
700             $meta = $updater->getmeta($filename);
701         }
703         next unless ( $meta->{revision} );
705         my $oldmeta = $meta;
707         my $wrev = revparse($filename);
709         # If the working copy is an old revision, lets get that version too for comparison.
710         if ( defined($wrev) and $wrev != $meta->{revision} )
711         {
712             $oldmeta = $updater->getmeta($filename, $wrev);
713         }
715         #$log->debug("Target revision is $meta->{revision}, current working revision is $wrev");
717         # Files are up to date if the working copy and repo copy have the same revision,
718         # and the working copy is unmodified _and_ the user hasn't specified -C
719         next if ( defined ( $wrev )
720                   and defined($meta->{revision})
721                   and $wrev == $meta->{revision}
722                   and $state->{entries}{$filename}{unchanged}
723                   and not exists ( $state->{opt}{C} ) );
725         # If the working copy and repo copy have the same revision,
726         # but the working copy is modified, tell the client it's modified
727         if ( defined ( $wrev )
728              and defined($meta->{revision})
729              and $wrev == $meta->{revision}
730              and not exists ( $state->{opt}{C} ) )
731         {
732             $log->info("Tell the client the file is modified");
733             print "MT text U\n";
734             print "MT fname $filename\n";
735             print "MT newline\n";
736             next;
737         }
739         if ( $meta->{filehash} eq "deleted" )
740         {
741             my ( $filepart, $dirpart ) = filenamesplit($filename);
743             $log->info("Removing '$filename' from working copy (no longer in the repo)");
745             print "E cvs update: `$filename' is no longer in the repository\n";
746             print "Removed $dirpart\n";
747             print "$filepart\n";
748         }
749         elsif ( not defined ( $state->{entries}{$filename}{modified_hash} )
750                 or $state->{entries}{$filename}{modified_hash} eq $oldmeta->{filehash} )
751         {
752             $log->info("Updating '$filename'");
753             # normal update, just send the new revision (either U=Update, or A=Add, or R=Remove)
754             print "MT +updated\n";
755             print "MT text U\n";
756             print "MT fname $filename\n";
757             print "MT newline\n";
758             print "MT -updated\n";
760             my ( $filepart, $dirpart ) = filenamesplit($filename);
761             $dirpart =~ s/^$state->{directory}//;
763             if ( defined ( $wrev ) )
764             {
765                 # instruct client we're sending a file to put in this path as a replacement
766                 print "Update-existing $dirpart\n";
767                 $log->debug("Updating existing file 'Update-existing $dirpart'");
768             } else {
769                 # instruct client we're sending a file to put in this path as a new file
770                 print "Created $dirpart\n";
771                 $log->debug("Creating new file 'Created $dirpart'");
772             }
773             print $state->{CVSROOT} . "/$state->{module}/$filename\n";
775             # this is an "entries" line
776             $log->debug("/$filepart/1.$meta->{revision}///");
777             print "/$filepart/1.$meta->{revision}///\n";
779             # permissions
780             $log->debug("SEND : u=$meta->{mode},g=$meta->{mode},o=$meta->{mode}");
781             print "u=$meta->{mode},g=$meta->{mode},o=$meta->{mode}\n";
783             # transmit file
784             transmitfile($meta->{filehash});
785         } else {
786             $log->info("Updating '$filename'");
787             my ( $filepart, $dirpart ) = filenamesplit($meta->{name});
789             my $dir = tempdir( DIR => $TEMP_DIR, CLEANUP => 1 ) . "/";
791             chdir $dir;
792             my $file_local = $filepart . ".mine";
793             system("ln","-s",$state->{entries}{$filename}{modified_filename}, $file_local);
794             my $file_old = $filepart . "." . $oldmeta->{revision};
795             transmitfile($oldmeta->{filehash}, $file_old);
796             my $file_new = $filepart . "." . $meta->{revision};
797             transmitfile($meta->{filehash}, $file_new);
799             # we need to merge with the local changes ( M=successful merge, C=conflict merge )
800             $log->info("Merging $file_local, $file_old, $file_new");
802             $log->debug("Temporary directory for merge is $dir");
804             my $return = system("merge", $file_local, $file_old, $file_new);
805             $return >>= 8;
807             if ( $return == 0 )
808             {
809                 $log->info("Merged successfully");
810                 print "M M $filename\n";
811                 $log->debug("Update-existing $dirpart");
812                 print "Update-existing $dirpart\n";
813                 $log->debug($state->{CVSROOT} . "/$state->{module}/$filename");
814                 print $state->{CVSROOT} . "/$state->{module}/$filename\n";
815                 $log->debug("/$filepart/1.$meta->{revision}///");
816                 print "/$filepart/1.$meta->{revision}///\n";
817             }
818             elsif ( $return == 1 )
819             {
820                 $log->info("Merged with conflicts");
821                 print "M C $filename\n";
822                 print "Update-existing $dirpart\n";
823                 print $state->{CVSROOT} . "/$state->{module}/$filename\n";
824                 print "/$filepart/1.$meta->{revision}/+//\n";
825             }
826             else
827             {
828                 $log->warn("Merge failed");
829                 next;
830             }
832             # permissions
833             $log->debug("SEND : u=$meta->{mode},g=$meta->{mode},o=$meta->{mode}");
834             print "u=$meta->{mode},g=$meta->{mode},o=$meta->{mode}\n";
836             # transmit file, format is single integer on a line by itself (file
837             # size) followed by the file contents
838             # TODO : we should copy files in blocks
839             my $data = `cat $file_local`;
840             $log->debug("File size : " . length($data));
841             print length($data) . "\n";
842             print $data;
844             chdir "/";
845         }
847     }
849     print "ok\n";
852 sub req_ci
854     my ( $cmd, $data ) = @_;
856     argsplit("ci");
858     #$log->debug("State : " . Dumper($state));
860     $log->info("req_ci : " . ( defined($data) ? $data : "[NULL]" ));
862     if ( -e $state->{CVSROOT} . "/index" )
863     {
864         print "error 1 Index already exists in git repo\n";
865         exit;
866     }
868     my $lockfile = "$state->{CVSROOT}/refs/heads/$state->{module}.lock";
869     unless ( sysopen(LOCKFILE,$lockfile,O_EXCL|O_CREAT|O_WRONLY) )
870     {
871         print "error 1 Lock file '$lockfile' already exists, please try again\n";
872         exit;
873     }
875     # Grab a handle to the SQLite db and do any necessary updates
876     my $updater = GITCVS::updater->new($state->{CVSROOT}, $state->{module}, $log);
877     $updater->update();
879     my $tmpdir = tempdir ( DIR => $TEMP_DIR );
880     my ( undef, $file_index ) = tempfile ( DIR => $TEMP_DIR, OPEN => 0 );
881     $log->info("Lock successful, basing commit on '$tmpdir', index file is '$file_index'");
883     $ENV{GIT_DIR} = $state->{CVSROOT} . "/";
884     $ENV{GIT_INDEX_FILE} = $file_index;
886     chdir $tmpdir;
888     # populate the temporary index based
889     system("git-read-tree", $state->{module});
890     unless ($? == 0)
891     {
892         die "Error running git-read-tree $state->{module} $file_index $!";
893     }
894     $log->info("Created index '$file_index' with for head $state->{module} - exit status $?");
897     my @committedfiles = ();
899     # foreach file specified on the commandline ...
900     foreach my $filename ( @{$state->{args}} )
901     {
902         $filename = filecleanup($filename);
904         next unless ( exists $state->{entries}{$filename}{modified_filename} or not $state->{entries}{$filename}{unchanged} );
906         my $meta = $updater->getmeta($filename);
908         my $wrev = revparse($filename);
910         my ( $filepart, $dirpart ) = filenamesplit($filename);
912         # do a checkout of the file if it part of this tree
913         if ($wrev) {
914             system('git-checkout-index', '-f', '-u', $filename);
915             unless ($? == 0) {
916                 die "Error running git-checkout-index -f -u $filename : $!";
917             }
918         }
920         my $addflag = 0;
921         my $rmflag = 0;
922         $rmflag = 1 if ( defined($wrev) and $wrev < 0 );
923         $addflag = 1 unless ( -e $filename );
925         # Do up to date checking
926         unless ( $addflag or $wrev == $meta->{revision} or ( $rmflag and -$wrev == $meta->{revision} ) )
927         {
928             # fail everything if an up to date check fails
929             print "error 1 Up to date check failed for $filename\n";
930             close LOCKFILE;
931             unlink($lockfile);
932             chdir "/";
933             exit;
934         }
936         push @committedfiles, $filename;
937         $log->info("Committing $filename");
939         system("mkdir","-p",$dirpart) unless ( -d $dirpart );
941         unless ( $rmflag )
942         {
943             $log->debug("rename $state->{entries}{$filename}{modified_filename} $filename");
944             rename $state->{entries}{$filename}{modified_filename},$filename;
946             # Calculate modes to remove
947             my $invmode = "";
948             foreach ( qw (r w x) ) { $invmode .= $_ unless ( $state->{entries}{$filename}{modified_mode} =~ /$_/ ); }
950             $log->debug("chmod u+" . $state->{entries}{$filename}{modified_mode} . "-" . $invmode . " $filename");
951             system("chmod","u+" .  $state->{entries}{$filename}{modified_mode} . "-" . $invmode, $filename);
952         }
954         if ( $rmflag )
955         {
956             $log->info("Removing file '$filename'");
957             unlink($filename);
958             system("git-update-index", "--remove", $filename);
959         }
960         elsif ( $addflag )
961         {
962             $log->info("Adding file '$filename'");
963             system("git-update-index", "--add", $filename);
964         } else {
965             $log->info("Updating file '$filename'");
966             system("git-update-index", $filename);
967         }
968     }
970     unless ( scalar(@committedfiles) > 0 )
971     {
972         print "E No files to commit\n";
973         print "ok\n";
974         close LOCKFILE;
975         unlink($lockfile);
976         chdir "/";
977         return;
978     }
980     my $treehash = `git-write-tree`;
981     my $parenthash = `cat $ENV{GIT_DIR}refs/heads/$state->{module}`;
982     chomp $treehash;
983     chomp $parenthash;
985     $log->debug("Treehash : $treehash, Parenthash : $parenthash");
987     # write our commit message out if we have one ...
988     my ( $msg_fh, $msg_filename ) = tempfile( DIR => $TEMP_DIR );
989     print $msg_fh $state->{opt}{m};# if ( exists ( $state->{opt}{m} ) );
990     print $msg_fh "\n\nvia git-CVS emulator\n";
991     close $msg_fh;
993     my $commithash = `git-commit-tree $treehash -p $parenthash < $msg_filename`;
994     $log->info("Commit hash : $commithash");
996     unless ( $commithash =~ /[a-zA-Z0-9]{40}/ )
997     {
998         $log->warn("Commit failed (Invalid commit hash)");
999         print "error 1 Commit failed (unknown reason)\n";
1000         close LOCKFILE;
1001         unlink($lockfile);
1002         chdir "/";
1003         exit;
1004     }
1006     open FILE, ">", "$ENV{GIT_DIR}refs/heads/$state->{module}";
1007     print FILE $commithash;
1008     close FILE;
1010     $updater->update();
1012     # foreach file specified on the commandline ...
1013     foreach my $filename ( @committedfiles )
1014     {
1015         $filename = filecleanup($filename);
1017         my $meta = $updater->getmeta($filename);
1019         my ( $filepart, $dirpart ) = filenamesplit($filename);
1021         $log->debug("Checked-in $dirpart : $filename");
1023         if ( $meta->{filehash} eq "deleted" )
1024         {
1025             print "Remove-entry $dirpart\n";
1026             print "$filename\n";
1027         } else {
1028             print "Checked-in $dirpart\n";
1029             print "$filename\n";
1030             print "/$filepart/1.$meta->{revision}///\n";
1031         }
1032     }
1034     close LOCKFILE;
1035     unlink($lockfile);
1036     chdir "/";
1038     print "ok\n";
1041 sub req_status
1043     my ( $cmd, $data ) = @_;
1045     argsplit("status");
1047     $log->info("req_status : " . ( defined($data) ? $data : "[NULL]" ));
1048     #$log->debug("status state : " . Dumper($state));
1050     # Grab a handle to the SQLite db and do any necessary updates
1051     my $updater = GITCVS::updater->new($state->{CVSROOT}, $state->{module}, $log);
1052     $updater->update();
1054     # if no files were specified, we need to work out what files we should be providing status on ...
1055     argsfromdir($updater) if ( scalar ( @{$state->{args}} ) == 0 );
1057     # foreach file specified on the commandline ...
1058     foreach my $filename ( @{$state->{args}} )
1059     {
1060         $filename = filecleanup($filename);
1062         my $meta = $updater->getmeta($filename);
1063         my $oldmeta = $meta;
1065         my $wrev = revparse($filename);
1067         # If the working copy is an old revision, lets get that version too for comparison.
1068         if ( defined($wrev) and $wrev != $meta->{revision} )
1069         {
1070             $oldmeta = $updater->getmeta($filename, $wrev);
1071         }
1073         # TODO : All possible statuses aren't yet implemented
1074         my $status;
1075         # Files are up to date if the working copy and repo copy have the same revision, and the working copy is unmodified
1076         $status = "Up-to-date" if ( defined ( $wrev ) and defined($meta->{revision}) and $wrev == $meta->{revision}
1077                                     and
1078                                     ( ( $state->{entries}{$filename}{unchanged} and ( not defined ( $state->{entries}{$filename}{conflict} ) or $state->{entries}{$filename}{conflict} !~ /^\+=/ ) )
1079                                       or ( defined($state->{entries}{$filename}{modified_hash}) and $state->{entries}{$filename}{modified_hash} eq $meta->{filehash} ) )
1080                                    );
1082         # Need checkout if the working copy has an older revision than the repo copy, and the working copy is unmodified
1083         $status ||= "Needs Checkout" if ( defined ( $wrev ) and defined ( $meta->{revision} ) and $meta->{revision} > $wrev
1084                                           and
1085                                           ( $state->{entries}{$filename}{unchanged}
1086                                             or ( defined($state->{entries}{$filename}{modified_hash}) and $state->{entries}{$filename}{modified_hash} eq $oldmeta->{filehash} ) )
1087                                         );
1089         # Need checkout if it exists in the repo but doesn't have a working copy
1090         $status ||= "Needs Checkout" if ( not defined ( $wrev ) and defined ( $meta->{revision} ) );
1092         # Locally modified if working copy and repo copy have the same revision but there are local changes
1093         $status ||= "Locally Modified" if ( defined ( $wrev ) and defined($meta->{revision}) and $wrev == $meta->{revision} and $state->{entries}{$filename}{modified_filename} );
1095         # Needs Merge if working copy revision is less than repo copy and there are local changes
1096         $status ||= "Needs Merge" if ( defined ( $wrev ) and defined ( $meta->{revision} ) and $meta->{revision} > $wrev and $state->{entries}{$filename}{modified_filename} );
1098         $status ||= "Locally Added" if ( defined ( $state->{entries}{$filename}{revision} ) and not defined ( $meta->{revision} ) );
1099         $status ||= "Locally Removed" if ( defined ( $wrev ) and defined ( $meta->{revision} ) and -$wrev == $meta->{revision} );
1100         $status ||= "Unresolved Conflict" if ( defined ( $state->{entries}{$filename}{conflict} ) and $state->{entries}{$filename}{conflict} =~ /^\+=/ );
1101         $status ||= "File had conflicts on merge" if ( 0 );
1103         $status ||= "Unknown";
1105         print "M ===================================================================\n";
1106         print "M File: $filename\tStatus: $status\n";
1107         if ( defined($state->{entries}{$filename}{revision}) )
1108         {
1109             print "M Working revision:\t" . $state->{entries}{$filename}{revision} . "\n";
1110         } else {
1111             print "M Working revision:\tNo entry for $filename\n";
1112         }
1113         if ( defined($meta->{revision}) )
1114         {
1115             print "M Repository revision:\t1." . $meta->{revision} . "\t$state->{repository}/$filename,v\n";
1116             print "M Sticky Tag:\t\t(none)\n";
1117             print "M Sticky Date:\t\t(none)\n";
1118             print "M Sticky Options:\t\t(none)\n";
1119         } else {
1120             print "M Repository revision:\tNo revision control file\n";
1121         }
1122         print "M\n";
1123     }
1125     print "ok\n";
1128 sub req_diff
1130     my ( $cmd, $data ) = @_;
1132     argsplit("diff");
1134     $log->debug("req_diff : " . ( defined($data) ? $data : "[NULL]" ));
1135     #$log->debug("status state : " . Dumper($state));
1137     my ($revision1, $revision2);
1138     if ( defined ( $state->{opt}{r} ) and ref $state->{opt}{r} eq "ARRAY" )
1139     {
1140         $revision1 = $state->{opt}{r}[0];
1141         $revision2 = $state->{opt}{r}[1];
1142     } else {
1143         $revision1 = $state->{opt}{r};
1144     }
1146     $revision1 =~ s/^1\.// if ( defined ( $revision1 ) );
1147     $revision2 =~ s/^1\.// if ( defined ( $revision2 ) );
1149     $log->debug("Diffing revisions " . ( defined($revision1) ? $revision1 : "[NULL]" ) . " and " . ( defined($revision2) ? $revision2 : "[NULL]" ) );
1151     # Grab a handle to the SQLite db and do any necessary updates
1152     my $updater = GITCVS::updater->new($state->{CVSROOT}, $state->{module}, $log);
1153     $updater->update();
1155     # if no files were specified, we need to work out what files we should be providing status on ...
1156     argsfromdir($updater) if ( scalar ( @{$state->{args}} ) == 0 );
1158     # foreach file specified on the commandline ...
1159     foreach my $filename ( @{$state->{args}} )
1160     {
1161         $filename = filecleanup($filename);
1163         my ( $fh, $file1, $file2, $meta1, $meta2, $filediff );
1165         my $wrev = revparse($filename);
1167         # We need _something_ to diff against
1168         next unless ( defined ( $wrev ) );
1170         # if we have a -r switch, use it
1171         if ( defined ( $revision1 ) )
1172         {
1173             ( undef, $file1 ) = tempfile( DIR => $TEMP_DIR, OPEN => 0 );
1174             $meta1 = $updater->getmeta($filename, $revision1);
1175             unless ( defined ( $meta1 ) and $meta1->{filehash} ne "deleted" )
1176             {
1177                 print "E File $filename at revision 1.$revision1 doesn't exist\n";
1178                 next;
1179             }
1180             transmitfile($meta1->{filehash}, $file1);
1181         }
1182         # otherwise we just use the working copy revision
1183         else
1184         {
1185             ( undef, $file1 ) = tempfile( DIR => $TEMP_DIR, OPEN => 0 );
1186             $meta1 = $updater->getmeta($filename, $wrev);
1187             transmitfile($meta1->{filehash}, $file1);
1188         }
1190         # if we have a second -r switch, use it too
1191         if ( defined ( $revision2 ) )
1192         {
1193             ( undef, $file2 ) = tempfile( DIR => $TEMP_DIR, OPEN => 0 );
1194             $meta2 = $updater->getmeta($filename, $revision2);
1196             unless ( defined ( $meta2 ) and $meta2->{filehash} ne "deleted" )
1197             {
1198                 print "E File $filename at revision 1.$revision2 doesn't exist\n";
1199                 next;
1200             }
1202             transmitfile($meta2->{filehash}, $file2);
1203         }
1204         # otherwise we just use the working copy
1205         else
1206         {
1207             $file2 = $state->{entries}{$filename}{modified_filename};
1208         }
1210         # if we have been given -r, and we don't have a $file2 yet, lets get one
1211         if ( defined ( $revision1 ) and not defined ( $file2 ) )
1212         {
1213             ( undef, $file2 ) = tempfile( DIR => $TEMP_DIR, OPEN => 0 );
1214             $meta2 = $updater->getmeta($filename, $wrev);
1215             transmitfile($meta2->{filehash}, $file2);
1216         }
1218         # We need to have retrieved something useful
1219         next unless ( defined ( $meta1 ) );
1221         # Files to date if the working copy and repo copy have the same revision, and the working copy is unmodified
1222         next if ( not defined ( $meta2 ) and $wrev == $meta1->{revision}
1223                   and
1224                    ( ( $state->{entries}{$filename}{unchanged} and ( not defined ( $state->{entries}{$filename}{conflict} ) or $state->{entries}{$filename}{conflict} !~ /^\+=/ ) )
1225                      or ( defined($state->{entries}{$filename}{modified_hash}) and $state->{entries}{$filename}{modified_hash} eq $meta1->{filehash} ) )
1226                   );
1228         # Apparently we only show diffs for locally modified files
1229         next unless ( defined($meta2) or defined ( $state->{entries}{$filename}{modified_filename} ) );
1231         print "M Index: $filename\n";
1232         print "M ===================================================================\n";
1233         print "M RCS file: $state->{CVSROOT}/$state->{module}/$filename,v\n";
1234         print "M retrieving revision 1.$meta1->{revision}\n" if ( defined ( $meta1 ) );
1235         print "M retrieving revision 1.$meta2->{revision}\n" if ( defined ( $meta2 ) );
1236         print "M diff ";
1237         foreach my $opt ( keys %{$state->{opt}} )
1238         {
1239             if ( ref $state->{opt}{$opt} eq "ARRAY" )
1240             {
1241                 foreach my $value ( @{$state->{opt}{$opt}} )
1242                 {
1243                     print "-$opt $value ";
1244                 }
1245             } else {
1246                 print "-$opt ";
1247                 print "$state->{opt}{$opt} " if ( defined ( $state->{opt}{$opt} ) );
1248             }
1249         }
1250         print "$filename\n";
1252         $log->info("Diffing $filename -r $meta1->{revision} -r " . ( $meta2->{revision} or "workingcopy" ));
1254         ( $fh, $filediff ) = tempfile ( DIR => $TEMP_DIR );
1256         if ( exists $state->{opt}{u} )
1257         {
1258             system("diff -u -L '$filename revision 1.$meta1->{revision}' -L '$filename " . ( defined($meta2->{revision}) ? "revision 1.$meta2->{revision}" : "working copy" ) . "' $file1 $file2 > $filediff");
1259         } else {
1260             system("diff $file1 $file2 > $filediff");
1261         }
1263         while ( <$fh> )
1264         {
1265             print "M $_";
1266         }
1267         close $fh;
1268     }
1270     print "ok\n";
1273 sub req_log
1275     my ( $cmd, $data ) = @_;
1277     argsplit("log");
1279     $log->debug("req_log : " . ( defined($data) ? $data : "[NULL]" ));
1280     #$log->debug("log state : " . Dumper($state));
1282     my ( $minrev, $maxrev );
1283     if ( defined ( $state->{opt}{r} ) and $state->{opt}{r} =~ /([\d.]+)?(::?)([\d.]+)?/ )
1284     {
1285         my $control = $2;
1286         $minrev = $1;
1287         $maxrev = $3;
1288         $minrev =~ s/^1\.// if ( defined ( $minrev ) );
1289         $maxrev =~ s/^1\.// if ( defined ( $maxrev ) );
1290         $minrev++ if ( defined($minrev) and $control eq "::" );
1291     }
1293     # Grab a handle to the SQLite db and do any necessary updates
1294     my $updater = GITCVS::updater->new($state->{CVSROOT}, $state->{module}, $log);
1295     $updater->update();
1297     # if no files were specified, we need to work out what files we should be providing status on ...
1298     argsfromdir($updater) if ( scalar ( @{$state->{args}} ) == 0 );
1300     # foreach file specified on the commandline ...
1301     foreach my $filename ( @{$state->{args}} )
1302     {
1303         $filename = filecleanup($filename);
1305         my $headmeta = $updater->getmeta($filename);
1307         my $revisions = $updater->getlog($filename);
1308         my $totalrevisions = scalar(@$revisions);
1310         if ( defined ( $minrev ) )
1311         {
1312             $log->debug("Removing revisions less than $minrev");
1313             while ( scalar(@$revisions) > 0 and $revisions->[-1]{revision} < $minrev )
1314             {
1315                 pop @$revisions;
1316             }
1317         }
1318         if ( defined ( $maxrev ) )
1319         {
1320             $log->debug("Removing revisions greater than $maxrev");
1321             while ( scalar(@$revisions) > 0 and $revisions->[0]{revision} > $maxrev )
1322             {
1323                 shift @$revisions;
1324             }
1325         }
1327         next unless ( scalar(@$revisions) );
1329         print "M \n";
1330         print "M RCS file: $state->{CVSROOT}/$state->{module}/$filename,v\n";
1331         print "M Working file: $filename\n";
1332         print "M head: 1.$headmeta->{revision}\n";
1333         print "M branch:\n";
1334         print "M locks: strict\n";
1335         print "M access list:\n";
1336         print "M symbolic names:\n";
1337         print "M keyword substitution: kv\n";
1338         print "M total revisions: $totalrevisions;\tselected revisions: " . scalar(@$revisions) . "\n";
1339         print "M description:\n";
1341         foreach my $revision ( @$revisions )
1342         {
1343             print "M ----------------------------\n";
1344             print "M revision 1.$revision->{revision}\n";
1345             # reformat the date for log output
1346             $revision->{modified} = sprintf('%04d/%02d/%02d %s', $3, $DATE_LIST->{$2}, $1, $4 ) if ( $revision->{modified} =~ /(\d+)\s+(\w+)\s+(\d+)\s+(\S+)/ and defined($DATE_LIST->{$2}) );
1347             $revision->{author} =~ s/\s+.*//;
1348             $revision->{author} =~ s/^(.{8}).*/$1/;
1349             print "M date: $revision->{modified};  author: $revision->{author};  state: " . ( $revision->{filehash} eq "deleted" ? "dead" : "Exp" ) . ";  lines: +2 -3\n";
1350             my $commitmessage = $updater->commitmessage($revision->{commithash});
1351             $commitmessage =~ s/^/M /mg;
1352             print $commitmessage . "\n";
1353         }
1354         print "M =============================================================================\n";
1355     }
1357     print "ok\n";
1360 sub req_annotate
1362     my ( $cmd, $data ) = @_;
1364     argsplit("annotate");
1366     $log->info("req_annotate : " . ( defined($data) ? $data : "[NULL]" ));
1367     #$log->debug("status state : " . Dumper($state));
1369     # Grab a handle to the SQLite db and do any necessary updates
1370     my $updater = GITCVS::updater->new($state->{CVSROOT}, $state->{module}, $log);
1371     $updater->update();
1373     # if no files were specified, we need to work out what files we should be providing annotate on ...
1374     argsfromdir($updater) if ( scalar ( @{$state->{args}} ) == 0 );
1376     # we'll need a temporary checkout dir
1377     my $tmpdir = tempdir ( DIR => $TEMP_DIR );
1378     my ( undef, $file_index ) = tempfile ( DIR => $TEMP_DIR, OPEN => 0 );
1379     $log->info("Temp checkoutdir creation successful, basing annotate session work on '$tmpdir', index file is '$file_index'");
1381     $ENV{GIT_DIR} = $state->{CVSROOT} . "/";
1382     $ENV{GIT_INDEX_FILE} = $file_index;
1384     chdir $tmpdir;
1386     # foreach file specified on the commandline ...
1387     foreach my $filename ( @{$state->{args}} )
1388     {
1389         $filename = filecleanup($filename);
1391         my $meta = $updater->getmeta($filename);
1393         next unless ( $meta->{revision} );
1395         # get all the commits that this file was in
1396         # in dense format -- aka skip dead revisions
1397         my $revisions   = $updater->gethistorydense($filename);
1398         my $lastseenin  = $revisions->[0][2];
1400         # populate the temporary index based on the latest commit were we saw
1401         # the file -- but do it cheaply without checking out any files
1402         # TODO: if we got a revision from the client, use that instead
1403         # to look up the commithash in sqlite (still good to default to
1404         # the current head as we do now)
1405         system("git-read-tree", $lastseenin);
1406         unless ($? == 0)
1407         {
1408             die "Error running git-read-tree $lastseenin $file_index $!";
1409         }
1410         $log->info("Created index '$file_index' with commit $lastseenin - exit status $?");
1412         # do a checkout of the file
1413         system('git-checkout-index', '-f', '-u', $filename);
1414         unless ($? == 0) {
1415             die "Error running git-checkout-index -f -u $filename : $!";
1416         }
1418         $log->info("Annotate $filename");
1420         # Prepare a file with the commits from the linearized
1421         # history that annotate should know about. This prevents
1422         # git-jsannotate telling us about commits we are hiding
1423         # from the client.
1425         open(ANNOTATEHINTS, ">$tmpdir/.annotate_hints") or die "Error opening > $tmpdir/.annotate_hints $!";
1426         for (my $i=0; $i < @$revisions; $i++)
1427         {
1428             print ANNOTATEHINTS $revisions->[$i][2];
1429             if ($i+1 < @$revisions) { # have we got a parent?
1430                 print ANNOTATEHINTS ' ' . $revisions->[$i+1][2];
1431             }
1432             print ANNOTATEHINTS "\n";
1433         }
1435         print ANNOTATEHINTS "\n";
1436         close ANNOTATEHINTS;
1438         my $annotatecmd = 'git-annotate';
1439         open(ANNOTATE, "-|", $annotatecmd, '-l', '-S', "$tmpdir/.annotate_hints", $filename)
1440             or die "Error invoking $annotatecmd -l -S $tmpdir/.annotate_hints $filename : $!";
1441         my $metadata = {};
1442         print "E Annotations for $filename\n";
1443         print "E ***************\n";
1444         while ( <ANNOTATE> )
1445         {
1446             if (m/^([a-zA-Z0-9]{40})\t\([^\)]*\)(.*)$/i)
1447             {
1448                 my $commithash = $1;
1449                 my $data = $2;
1450                 unless ( defined ( $metadata->{$commithash} ) )
1451                 {
1452                     $metadata->{$commithash} = $updater->getmeta($filename, $commithash);
1453                     $metadata->{$commithash}{author} =~ s/\s+.*//;
1454                     $metadata->{$commithash}{author} =~ s/^(.{8}).*/$1/;
1455                     $metadata->{$commithash}{modified} = sprintf("%02d-%s-%02d", $1, $2, $3) if ( $metadata->{$commithash}{modified} =~ /^(\d+)\s(\w+)\s\d\d(\d\d)/ );
1456                 }
1457                 printf("M 1.%-5d      (%-8s %10s): %s\n",
1458                     $metadata->{$commithash}{revision},
1459                     $metadata->{$commithash}{author},
1460                     $metadata->{$commithash}{modified},
1461                     $data
1462                 );
1463             } else {
1464                 $log->warn("Error in annotate output! LINE: $_");
1465                 print "E Annotate error \n";
1466                 next;
1467             }
1468         }
1469         close ANNOTATE;
1470     }
1472     # done; get out of the tempdir
1473     chdir "/";
1475     print "ok\n";
1479 # This method takes the state->{arguments} array and produces two new arrays.
1480 # The first is $state->{args} which is everything before the '--' argument, and
1481 # the second is $state->{files} which is everything after it.
1482 sub argsplit
1484     return unless( defined($state->{arguments}) and ref $state->{arguments} eq "ARRAY" );
1486     my $type = shift;
1488     $state->{args} = [];
1489     $state->{files} = [];
1490     $state->{opt} = {};
1492     if ( defined($type) )
1493     {
1494         my $opt = {};
1495         $opt = { A => 0, N => 0, P => 0, R => 0, c => 0, f => 0, l => 0, n => 0, p => 0, s => 0, r => 1, D => 1, d => 1, k => 1, j => 1, } if ( $type eq "co" );
1496         $opt = { v => 0, l => 0, R => 0 } if ( $type eq "status" );
1497         $opt = { A => 0, P => 0, C => 0, d => 0, f => 0, l => 0, R => 0, p => 0, k => 1, r => 1, D => 1, j => 1, I => 1, W => 1 } if ( $type eq "update" );
1498         $opt = { l => 0, R => 0, k => 1, D => 1, D => 1, r => 2 } if ( $type eq "diff" );
1499         $opt = { c => 0, R => 0, l => 0, f => 0, F => 1, m => 1, r => 1 } if ( $type eq "ci" );
1500         $opt = { k => 1, m => 1 } if ( $type eq "add" );
1501         $opt = { f => 0, l => 0, R => 0 } if ( $type eq "remove" );
1502         $opt = { l => 0, b => 0, h => 0, R => 0, t => 0, N => 0, S => 0, r => 1, d => 1, s => 1, w => 1 } if ( $type eq "log" );
1505         while ( scalar ( @{$state->{arguments}} ) > 0 )
1506         {
1507             my $arg = shift @{$state->{arguments}};
1509             next if ( $arg eq "--" );
1510             next unless ( $arg =~ /\S/ );
1512             # if the argument looks like a switch
1513             if ( $arg =~ /^-(\w)(.*)/ )
1514             {
1515                 # if it's a switch that takes an argument
1516                 if ( $opt->{$1} )
1517                 {
1518                     # If this switch has already been provided
1519                     if ( $opt->{$1} > 1 and exists ( $state->{opt}{$1} ) )
1520                     {
1521                         $state->{opt}{$1} = [ $state->{opt}{$1} ];
1522                         if ( length($2) > 0 )
1523                         {
1524                             push @{$state->{opt}{$1}},$2;
1525                         } else {
1526                             push @{$state->{opt}{$1}}, shift @{$state->{arguments}};
1527                         }
1528                     } else {
1529                         # if there's extra data in the arg, use that as the argument for the switch
1530                         if ( length($2) > 0 )
1531                         {
1532                             $state->{opt}{$1} = $2;
1533                         } else {
1534                             $state->{opt}{$1} = shift @{$state->{arguments}};
1535                         }
1536                     }
1537                 } else {
1538                     $state->{opt}{$1} = undef;
1539                 }
1540             }
1541             else
1542             {
1543                 push @{$state->{args}}, $arg;
1544             }
1545         }
1546     }
1547     else
1548     {
1549         my $mode = 0;
1551         foreach my $value ( @{$state->{arguments}} )
1552         {
1553             if ( $value eq "--" )
1554             {
1555                 $mode++;
1556                 next;
1557             }
1558             push @{$state->{args}}, $value if ( $mode == 0 );
1559             push @{$state->{files}}, $value if ( $mode == 1 );
1560         }
1561     }
1564 # This method uses $state->{directory} to populate $state->{args} with a list of filenames
1565 sub argsfromdir
1567     my $updater = shift;
1569     $state->{args} = [];
1571     foreach my $file ( @{$updater->gethead} )
1572     {
1573         next if ( $file->{filehash} eq "deleted" and not defined ( $state->{entries}{$file->{name}} ) );
1574         next unless ( $file->{name} =~ s/^$state->{directory}// );
1575         push @{$state->{args}}, $file->{name};
1576     }
1579 # This method cleans up the $state variable after a command that uses arguments has run
1580 sub statecleanup
1582     $state->{files} = [];
1583     $state->{args} = [];
1584     $state->{arguments} = [];
1585     $state->{entries} = {};
1588 sub revparse
1590     my $filename = shift;
1592     return undef unless ( defined ( $state->{entries}{$filename}{revision} ) );
1594     return $1 if ( $state->{entries}{$filename}{revision} =~ /^1\.(\d+)/ );
1595     return -$1 if ( $state->{entries}{$filename}{revision} =~ /^-1\.(\d+)/ );
1597     return undef;
1600 # This method takes a file hash and does a CVS "file transfer" which transmits the
1601 # size of the file, and then the file contents.
1602 # If a second argument $targetfile is given, the file is instead written out to
1603 # a file by the name of $targetfile
1604 sub transmitfile
1606     my $filehash = shift;
1607     my $targetfile = shift;
1609     if ( defined ( $filehash ) and $filehash eq "deleted" )
1610     {
1611         $log->warn("filehash is 'deleted'");
1612         return;
1613     }
1615     die "Need filehash" unless ( defined ( $filehash ) and $filehash =~ /^[a-zA-Z0-9]{40}$/ );
1617     my $type = `git-cat-file -t $filehash`;
1618     chomp $type;
1620     die ( "Invalid type '$type' (expected 'blob')" ) unless ( defined ( $type ) and $type eq "blob" );
1622     my $size = `git-cat-file -s $filehash`;
1623     chomp $size;
1625     $log->debug("transmitfile($filehash) size=$size, type=$type");
1627     if ( open my $fh, '-|', "git-cat-file", "blob", $filehash )
1628     {
1629         if ( defined ( $targetfile ) )
1630         {
1631             open NEWFILE, ">", $targetfile or die("Couldn't open '$targetfile' for writing : $!");
1632             print NEWFILE $_ while ( <$fh> );
1633             close NEWFILE;
1634         } else {
1635             print "$size\n";
1636             print while ( <$fh> );
1637         }
1638         close $fh or die ("Couldn't close filehandle for transmitfile()");
1639     } else {
1640         die("Couldn't execute git-cat-file");
1641     }
1644 # This method takes a file name, and returns ( $dirpart, $filepart ) which
1645 # refers to the directory porition and the file portion of the filename
1646 # respectively
1647 sub filenamesplit
1649     my $filename = shift;
1651     my ( $filepart, $dirpart ) = ( $filename, "." );
1652     ( $filepart, $dirpart ) = ( $2, $1 ) if ( $filename =~ /(.*)\/(.*)/ );
1653     $dirpart .= "/";
1655     return ( $filepart, $dirpart );
1658 sub filecleanup
1660     my $filename = shift;
1662     return undef unless(defined($filename));
1663     if ( $filename =~ /^\// )
1664     {
1665         print "E absolute filenames '$filename' not supported by server\n";
1666         return undef;
1667     }
1669     $filename =~ s/^\.\///g;
1670     $filename = $state->{directory} . $filename;
1672     return $filename;
1675 package GITCVS::log;
1677 ####
1678 #### Copyright The Open University UK - 2006.
1679 ####
1680 #### Authors: Martyn Smith    <martyn@catalyst.net.nz>
1681 ####          Martin Langhoff <martin@catalyst.net.nz>
1682 ####
1683 ####
1685 use strict;
1686 use warnings;
1688 =head1 NAME
1690 GITCVS::log
1692 =head1 DESCRIPTION
1694 This module provides very crude logging with a similar interface to
1695 Log::Log4perl
1697 =head1 METHODS
1699 =cut
1701 =head2 new
1703 Creates a new log object, optionally you can specify a filename here to
1704 indicate the file to log to. If no log file is specified, you can specifiy one
1705 later with method setfile, or indicate you no longer want logging with method
1706 nofile.
1708 Until one of these methods is called, all log calls will buffer messages ready
1709 to write out.
1711 =cut
1712 sub new
1714     my $class = shift;
1715     my $filename = shift;
1717     my $self = {};
1719     bless $self, $class;
1721     if ( defined ( $filename ) )
1722     {
1723         open $self->{fh}, ">>", $filename or die("Couldn't open '$filename' for writing : $!");
1724     }
1726     return $self;
1729 =head2 setfile
1731 This methods takes a filename, and attempts to open that file as the log file.
1732 If successful, all buffered data is written out to the file, and any further
1733 logging is written directly to the file.
1735 =cut
1736 sub setfile
1738     my $self = shift;
1739     my $filename = shift;
1741     if ( defined ( $filename ) )
1742     {
1743         open $self->{fh}, ">>", $filename or die("Couldn't open '$filename' for writing : $!");
1744     }
1746     return unless ( defined ( $self->{buffer} ) and ref $self->{buffer} eq "ARRAY" );
1748     while ( my $line = shift @{$self->{buffer}} )
1749     {
1750         print {$self->{fh}} $line;
1751     }
1754 =head2 nofile
1756 This method indicates no logging is going to be used. It flushes any entries in
1757 the internal buffer, and sets a flag to ensure no further data is put there.
1759 =cut
1760 sub nofile
1762     my $self = shift;
1764     $self->{nolog} = 1;
1766     return unless ( defined ( $self->{buffer} ) and ref $self->{buffer} eq "ARRAY" );
1768     $self->{buffer} = [];
1771 =head2 _logopen
1773 Internal method. Returns true if the log file is open, false otherwise.
1775 =cut
1776 sub _logopen
1778     my $self = shift;
1780     return 1 if ( defined ( $self->{fh} ) and ref $self->{fh} eq "GLOB" );
1781     return 0;
1784 =head2 debug info warn fatal
1786 These four methods are wrappers to _log. They provide the actual interface for
1787 logging data.
1789 =cut
1790 sub debug { my $self = shift; $self->_log("debug", @_); }
1791 sub info  { my $self = shift; $self->_log("info" , @_); }
1792 sub warn  { my $self = shift; $self->_log("warn" , @_); }
1793 sub fatal { my $self = shift; $self->_log("fatal", @_); }
1795 =head2 _log
1797 This is an internal method called by the logging functions. It generates a
1798 timestamp and pushes the logged line either to file, or internal buffer.
1800 =cut
1801 sub _log
1803     my $self = shift;
1804     my $level = shift;
1806     return if ( $self->{nolog} );
1808     my @time = localtime;
1809     my $timestring = sprintf("%4d-%02d-%02d %02d:%02d:%02d : %-5s",
1810         $time[5] + 1900,
1811         $time[4] + 1,
1812         $time[3],
1813         $time[2],
1814         $time[1],
1815         $time[0],
1816         uc $level,
1817     );
1819     if ( $self->_logopen )
1820     {
1821         print {$self->{fh}} $timestring . " - " . join(" ",@_) . "\n";
1822     } else {
1823         push @{$self->{buffer}}, $timestring . " - " . join(" ",@_) . "\n";
1824     }
1827 =head2 DESTROY
1829 This method simply closes the file handle if one is open
1831 =cut
1832 sub DESTROY
1834     my $self = shift;
1836     if ( $self->_logopen )
1837     {
1838         close $self->{fh};
1839     }
1842 package GITCVS::updater;
1844 ####
1845 #### Copyright The Open University UK - 2006.
1846 ####
1847 #### Authors: Martyn Smith    <martyn@catalyst.net.nz>
1848 ####          Martin Langhoff <martin@catalyst.net.nz>
1849 ####
1850 ####
1852 use strict;
1853 use warnings;
1854 use DBI;
1856 =head1 METHODS
1858 =cut
1860 =head2 new
1862 =cut
1863 sub new
1865     my $class = shift;
1866     my $config = shift;
1867     my $module = shift;
1868     my $log = shift;
1870     die "Need to specify a git repository" unless ( defined($config) and -d $config );
1871     die "Need to specify a module" unless ( defined($module) );
1873     $class = ref($class) || $class;
1875     my $self = {};
1877     bless $self, $class;
1879     $self->{dbdir} = $config . "/";
1880     die "Database dir '$self->{dbdir}' isn't a directory" unless ( defined($self->{dbdir}) and -d $self->{dbdir} );
1882     $self->{module} = $module;
1883     $self->{file} = $self->{dbdir} . "/gitcvs.$module.sqlite";
1885     $self->{git_path} = $config . "/";
1887     $self->{log} = $log;
1889     die "Git repo '$self->{git_path}' doesn't exist" unless ( -d $self->{git_path} );
1891     $self->{dbh} = DBI->connect("dbi:SQLite:dbname=" . $self->{file},"","");
1893     $self->{tables} = {};
1894     foreach my $table ( $self->{dbh}->tables )
1895     {
1896         $table =~ s/^"//;
1897         $table =~ s/"$//;
1898         $self->{tables}{$table} = 1;
1899     }
1901     # Construct the revision table if required
1902     unless ( $self->{tables}{revision} )
1903     {
1904         $self->{dbh}->do("
1905             CREATE TABLE revision (
1906                 name       TEXT NOT NULL,
1907                 revision   INTEGER NOT NULL,
1908                 filehash   TEXT NOT NULL,
1909                 commithash TEXT NOT NULL,
1910                 author     TEXT NOT NULL,
1911                 modified   TEXT NOT NULL,
1912                 mode       TEXT NOT NULL
1913             )
1914         ");
1915     }
1917     # Construct the revision table if required
1918     unless ( $self->{tables}{head} )
1919     {
1920         $self->{dbh}->do("
1921             CREATE TABLE head (
1922                 name       TEXT NOT NULL,
1923                 revision   INTEGER NOT NULL,
1924                 filehash   TEXT NOT NULL,
1925                 commithash TEXT NOT NULL,
1926                 author     TEXT NOT NULL,
1927                 modified   TEXT NOT NULL,
1928                 mode       TEXT NOT NULL
1929             )
1930         ");
1931     }
1933     # Construct the properties table if required
1934     unless ( $self->{tables}{properties} )
1935     {
1936         $self->{dbh}->do("
1937             CREATE TABLE properties (
1938                 key        TEXT NOT NULL PRIMARY KEY,
1939                 value      TEXT
1940             )
1941         ");
1942     }
1944     # Construct the commitmsgs table if required
1945     unless ( $self->{tables}{commitmsgs} )
1946     {
1947         $self->{dbh}->do("
1948             CREATE TABLE commitmsgs (
1949                 key        TEXT NOT NULL PRIMARY KEY,
1950                 value      TEXT
1951             )
1952         ");
1953     }
1955     return $self;
1958 =head2 update
1960 =cut
1961 sub update
1963     my $self = shift;
1965     # first lets get the commit list
1966     $ENV{GIT_DIR} = $self->{git_path};
1968     # prepare database queries
1969     my $db_insert_rev = $self->{dbh}->prepare_cached("INSERT INTO revision (name, revision, filehash, commithash, modified, author, mode) VALUES (?,?,?,?,?,?,?)",{},1);
1970     my $db_insert_mergelog = $self->{dbh}->prepare_cached("INSERT INTO commitmsgs (key, value) VALUES (?,?)",{},1);
1971     my $db_delete_head = $self->{dbh}->prepare_cached("DELETE FROM head",{},1);
1972     my $db_insert_head = $self->{dbh}->prepare_cached("INSERT INTO head (name, revision, filehash, commithash, modified, author, mode) VALUES (?,?,?,?,?,?,?)",{},1);
1974     my $commitinfo = `git-cat-file commit $self->{module} 2>&1`;
1975     unless ( $commitinfo =~ /tree\s+[a-zA-Z0-9]{40}/ )
1976     {
1977         die("Invalid module '$self->{module}'");
1978     }
1981     my $git_log;
1982     my $lastcommit = $self->_get_prop("last_commit");
1984     # Start exclusive lock here...
1985     $self->{dbh}->begin_work() or die "Cannot lock database for BEGIN";
1987     # TODO: log processing is memory bound
1988     # if we can parse into a 2nd file that is in reverse order
1989     # we can probably do something really efficient
1990     my @git_log_params = ('--parents', '--topo-order');
1992     if (defined $lastcommit) {
1993         push @git_log_params, "$lastcommit..$self->{module}";
1994     } else {
1995         push @git_log_params, $self->{module};
1996     }
1997     open(GITLOG, '-|', 'git-log', @git_log_params) or die "Cannot call git-log: $!";
1999     my @commits;
2001     my %commit = ();
2003     while ( <GITLOG> )
2004     {
2005         chomp;
2006         if (m/^commit\s+(.*)$/) {
2007             # on ^commit lines put the just seen commit in the stack
2008             # and prime things for the next one
2009             if (keys %commit) {
2010                 my %copy = %commit;
2011                 unshift @commits, \%copy;
2012                 %commit = ();
2013             }
2014             my @parents = split(m/\s+/, $1);
2015             $commit{hash} = shift @parents;
2016             $commit{parents} = \@parents;
2017         } elsif (m/^(\w+?):\s+(.*)$/ && !exists($commit{message})) {
2018             # on rfc822-like lines seen before we see any message,
2019             # lowercase the entry and put it in the hash as key-value
2020             $commit{lc($1)} = $2;
2021         } else {
2022             # message lines - skip initial empty line
2023             # and trim whitespace
2024             if (!exists($commit{message}) && m/^\s*$/) {
2025                 # define it to mark the end of headers
2026                 $commit{message} = '';
2027                 next;
2028             }
2029             s/^\s+//; s/\s+$//; # trim ws
2030             $commit{message} .= $_ . "\n";
2031         }
2032     }
2033     close GITLOG;
2035     unshift @commits, \%commit if ( keys %commit );
2037     # Now all the commits are in the @commits bucket
2038     # ordered by time DESC. for each commit that needs processing,
2039     # determine whether it's following the last head we've seen or if
2040     # it's on its own branch, grab a file list, and add whatever's changed
2041     # NOTE: $lastcommit refers to the last commit from previous run
2042     #       $lastpicked is the last commit we picked in this run
2043     my $lastpicked;
2044     my $head = {};
2045     if (defined $lastcommit) {
2046         $lastpicked = $lastcommit;
2047     }
2049     my $committotal = scalar(@commits);
2050     my $commitcount = 0;
2052     # Load the head table into $head (for cached lookups during the update process)
2053     foreach my $file ( @{$self->gethead()} )
2054     {
2055         $head->{$file->{name}} = $file;
2056     }
2058     foreach my $commit ( @commits )
2059     {
2060         $self->{log}->debug("GITCVS::updater - Processing commit $commit->{hash} (" . (++$commitcount) . " of $committotal)");
2061         if (defined $lastpicked)
2062         {
2063             if (!in_array($lastpicked, @{$commit->{parents}}))
2064             {
2065                 # skip, we'll see this delta
2066                 # as part of a merge later
2067                 # warn "skipping off-track  $commit->{hash}\n";
2068                 next;
2069             } elsif (@{$commit->{parents}} > 1) {
2070                 # it is a merge commit, for each parent that is
2071                 # not $lastpicked, see if we can get a log
2072                 # from the merge-base to that parent to put it
2073                 # in the message as a merge summary.
2074                 my @parents = @{$commit->{parents}};
2075                 foreach my $parent (@parents) {
2076                     # git-merge-base can potentially (but rarely) throw
2077                     # several candidate merge bases. let's assume
2078                     # that the first one is the best one.
2079                     if ($parent eq $lastpicked) {
2080                         next;
2081                     }
2082                     open my $p, 'git-merge-base '. $lastpicked . ' '
2083                     . $parent . '|';
2084                     my @output = (<$p>);
2085                     close $p;
2086                     my $base = join('', @output);
2087                     chomp $base;
2088                     if ($base) {
2089                         my @merged;
2090                         # print "want to log between  $base $parent \n";
2091                         open(GITLOG, '-|', 'git-log', "$base..$parent")
2092                         or die "Cannot call git-log: $!";
2093                         my $mergedhash;
2094                         while (<GITLOG>) {
2095                             chomp;
2096                             if (!defined $mergedhash) {
2097                                 if (m/^commit\s+(.+)$/) {
2098                                     $mergedhash = $1;
2099                                 } else {
2100                                     next;
2101                                 }
2102                             } else {
2103                                 # grab the first line that looks non-rfc822
2104                                 # aka has content after leading space
2105                                 if (m/^\s+(\S.*)$/) {
2106                                     my $title = $1;
2107                                     $title = substr($title,0,100); # truncate
2108                                     unshift @merged, "$mergedhash $title";
2109                                     undef $mergedhash;
2110                                 }
2111                             }
2112                         }
2113                         close GITLOG;
2114                         if (@merged) {
2115                             $commit->{mergemsg} = $commit->{message};
2116                             $commit->{mergemsg} .= "\nSummary of merged commits:\n\n";
2117                             foreach my $summary (@merged) {
2118                                 $commit->{mergemsg} .= "\t$summary\n";
2119                             }
2120                             $commit->{mergemsg} .= "\n\n";
2121                             # print "Message for $commit->{hash} \n$commit->{mergemsg}";
2122                         }
2123                     }
2124                 }
2125             }
2126         }
2128         # convert the date to CVS-happy format
2129         $commit->{date} = "$2 $1 $4 $3 $5" if ( $commit->{date} =~ /^\w+\s+(\w+)\s+(\d+)\s+(\d+:\d+:\d+)\s+(\d+)\s+([+-]\d+)$/ );
2131         if ( defined ( $lastpicked ) )
2132         {
2133             my $filepipe = open(FILELIST, '-|', 'git-diff-tree', '-r', $lastpicked, $commit->{hash}) or die("Cannot call git-diff-tree : $!");
2134             while ( <FILELIST> )
2135             {
2136                 unless ( /^:\d{6}\s+\d{3}(\d)\d{2}\s+[a-zA-Z0-9]{40}\s+([a-zA-Z0-9]{40})\s+(\w)\s+(.*)$/o )
2137                 {
2138                     die("Couldn't process git-diff-tree line : $_");
2139                 }
2141                 # $log->debug("File mode=$1, hash=$2, change=$3, name=$4");
2143                 my $git_perms = "";
2144                 $git_perms .= "r" if ( $1 & 4 );
2145                 $git_perms .= "w" if ( $1 & 2 );
2146                 $git_perms .= "x" if ( $1 & 1 );
2147                 $git_perms = "rw" if ( $git_perms eq "" );
2149                 if ( $3 eq "D" )
2150                 {
2151                     #$log->debug("DELETE   $4");
2152                     $head->{$4} = {
2153                         name => $4,
2154                         revision => $head->{$4}{revision} + 1,
2155                         filehash => "deleted",
2156                         commithash => $commit->{hash},
2157                         modified => $commit->{date},
2158                         author => $commit->{author},
2159                         mode => $git_perms,
2160                     };
2161                     $db_insert_rev->execute($4, $head->{$4}{revision}, $2, $commit->{hash}, $commit->{date}, $commit->{author}, $git_perms);
2162                 }
2163                 elsif ( $3 eq "M" )
2164                 {
2165                     #$log->debug("MODIFIED $4");
2166                     $head->{$4} = {
2167                         name => $4,
2168                         revision => $head->{$4}{revision} + 1,
2169                         filehash => $2,
2170                         commithash => $commit->{hash},
2171                         modified => $commit->{date},
2172                         author => $commit->{author},
2173                         mode => $git_perms,
2174                     };
2175                     $db_insert_rev->execute($4, $head->{$4}{revision}, $2, $commit->{hash}, $commit->{date}, $commit->{author}, $git_perms);
2176                 }
2177                 elsif ( $3 eq "A" )
2178                 {
2179                     #$log->debug("ADDED    $4");
2180                     $head->{$4} = {
2181                         name => $4,
2182                         revision => 1,
2183                         filehash => $2,
2184                         commithash => $commit->{hash},
2185                         modified => $commit->{date},
2186                         author => $commit->{author},
2187                         mode => $git_perms,
2188                     };
2189                     $db_insert_rev->execute($4, $head->{$4}{revision}, $2, $commit->{hash}, $commit->{date}, $commit->{author}, $git_perms);
2190                 }
2191                 else
2192                 {
2193                     $log->warn("UNKNOWN FILE CHANGE mode=$1, hash=$2, change=$3, name=$4");
2194                     die;
2195                 }
2196             }
2197             close FILELIST;
2198         } else {
2199             # this is used to detect files removed from the repo
2200             my $seen_files = {};
2202             my $filepipe = open(FILELIST, '-|', 'git-ls-tree', '-r', $commit->{hash}) or die("Cannot call git-ls-tree : $!");
2203             while ( <FILELIST> )
2204             {
2205                 unless ( /^(\d+)\s+(\w+)\s+([a-zA-Z0-9]+)\s+(.*)$/o )
2206                 {
2207                     die("Couldn't process git-ls-tree line : $_");
2208                 }
2210                 my ( $git_perms, $git_type, $git_hash, $git_filename ) = ( $1, $2, $3, $4 );
2212                 $seen_files->{$git_filename} = 1;
2214                 my ( $oldhash, $oldrevision, $oldmode ) = (
2215                     $head->{$git_filename}{filehash},
2216                     $head->{$git_filename}{revision},
2217                     $head->{$git_filename}{mode}
2218                 );
2220                 if ( $git_perms =~ /^\d\d\d(\d)\d\d/o )
2221                 {
2222                     $git_perms = "";
2223                     $git_perms .= "r" if ( $1 & 4 );
2224                     $git_perms .= "w" if ( $1 & 2 );
2225                     $git_perms .= "x" if ( $1 & 1 );
2226                 } else {
2227                     $git_perms = "rw";
2228                 }
2230                 # unless the file exists with the same hash, we need to update it ...
2231                 unless ( defined($oldhash) and $oldhash eq $git_hash and defined($oldmode) and $oldmode eq $git_perms )
2232                 {
2233                     my $newrevision = ( $oldrevision or 0 ) + 1;
2235                     $head->{$git_filename} = {
2236                         name => $git_filename,
2237                         revision => $newrevision,
2238                         filehash => $git_hash,
2239                         commithash => $commit->{hash},
2240                         modified => $commit->{date},
2241                         author => $commit->{author},
2242                         mode => $git_perms,
2243                     };
2246                     $db_insert_rev->execute($git_filename, $newrevision, $git_hash, $commit->{hash}, $commit->{date}, $commit->{author}, $git_perms);
2247                 }
2248             }
2249             close FILELIST;
2251             # Detect deleted files
2252             foreach my $file ( keys %$head )
2253             {
2254                 unless ( exists $seen_files->{$file} or $head->{$file}{filehash} eq "deleted" )
2255                 {
2256                     $head->{$file}{revision}++;
2257                     $head->{$file}{filehash} = "deleted";
2258                     $head->{$file}{commithash} = $commit->{hash};
2259                     $head->{$file}{modified} = $commit->{date};
2260                     $head->{$file}{author} = $commit->{author};
2262                     $db_insert_rev->execute($file, $head->{$file}{revision}, $head->{$file}{filehash}, $commit->{hash}, $commit->{date}, $commit->{author}, $head->{$file}{mode});
2263                 }
2264             }
2265             # END : "Detect deleted files"
2266         }
2269         if (exists $commit->{mergemsg})
2270         {
2271             $db_insert_mergelog->execute($commit->{hash}, $commit->{mergemsg});
2272         }
2274         $lastpicked = $commit->{hash};
2276         $self->_set_prop("last_commit", $commit->{hash});
2277     }
2279     $db_delete_head->execute();
2280     foreach my $file ( keys %$head )
2281     {
2282         $db_insert_head->execute(
2283             $file,
2284             $head->{$file}{revision},
2285             $head->{$file}{filehash},
2286             $head->{$file}{commithash},
2287             $head->{$file}{modified},
2288             $head->{$file}{author},
2289             $head->{$file}{mode},
2290         );
2291     }
2292     # invalidate the gethead cache
2293     $self->{gethead_cache} = undef;
2296     # Ending exclusive lock here
2297     $self->{dbh}->commit() or die "Failed to commit changes to SQLite";
2300 sub _headrev
2302     my $self = shift;
2303     my $filename = shift;
2305     my $db_query = $self->{dbh}->prepare_cached("SELECT filehash, revision, mode FROM head WHERE name=?",{},1);
2306     $db_query->execute($filename);
2307     my ( $hash, $revision, $mode ) = $db_query->fetchrow_array;
2309     return ( $hash, $revision, $mode );
2312 sub _get_prop
2314     my $self = shift;
2315     my $key = shift;
2317     my $db_query = $self->{dbh}->prepare_cached("SELECT value FROM properties WHERE key=?",{},1);
2318     $db_query->execute($key);
2319     my ( $value ) = $db_query->fetchrow_array;
2321     return $value;
2324 sub _set_prop
2326     my $self = shift;
2327     my $key = shift;
2328     my $value = shift;
2330     my $db_query = $self->{dbh}->prepare_cached("UPDATE properties SET value=? WHERE key=?",{},1);
2331     $db_query->execute($value, $key);
2333     unless ( $db_query->rows )
2334     {
2335         $db_query = $self->{dbh}->prepare_cached("INSERT INTO properties (key, value) VALUES (?,?)",{},1);
2336         $db_query->execute($key, $value);
2337     }
2339     return $value;
2342 =head2 gethead
2344 =cut
2346 sub gethead
2348     my $self = shift;
2350     return $self->{gethead_cache} if ( defined ( $self->{gethead_cache} ) );
2352     my $db_query = $self->{dbh}->prepare_cached("SELECT name, filehash, mode, revision, modified, commithash, author FROM head",{},1);
2353     $db_query->execute();
2355     my $tree = [];
2356     while ( my $file = $db_query->fetchrow_hashref )
2357     {
2358         push @$tree, $file;
2359     }
2361     $self->{gethead_cache} = $tree;
2363     return $tree;
2366 =head2 getlog
2368 =cut
2370 sub getlog
2372     my $self = shift;
2373     my $filename = shift;
2375     my $db_query = $self->{dbh}->prepare_cached("SELECT name, filehash, author, mode, revision, modified, commithash FROM revision WHERE name=? ORDER BY revision DESC",{},1);
2376     $db_query->execute($filename);
2378     my $tree = [];
2379     while ( my $file = $db_query->fetchrow_hashref )
2380     {
2381         push @$tree, $file;
2382     }
2384     return $tree;
2387 =head2 getmeta
2389 This function takes a filename (with path) argument and returns a hashref of
2390 metadata for that file.
2392 =cut
2394 sub getmeta
2396     my $self = shift;
2397     my $filename = shift;
2398     my $revision = shift;
2400     my $db_query;
2401     if ( defined($revision) and $revision =~ /^\d+$/ )
2402     {
2403         $db_query = $self->{dbh}->prepare_cached("SELECT * FROM revision WHERE name=? AND revision=?",{},1);
2404         $db_query->execute($filename, $revision);
2405     }
2406     elsif ( defined($revision) and $revision =~ /^[a-zA-Z0-9]{40}$/ )
2407     {
2408         $db_query = $self->{dbh}->prepare_cached("SELECT * FROM revision WHERE name=? AND commithash=?",{},1);
2409         $db_query->execute($filename, $revision);
2410     } else {
2411         $db_query = $self->{dbh}->prepare_cached("SELECT * FROM head WHERE name=?",{},1);
2412         $db_query->execute($filename);
2413     }
2415     return $db_query->fetchrow_hashref;
2418 =head2 commitmessage
2420 this function takes a commithash and returns the commit message for that commit
2422 =cut
2423 sub commitmessage
2425     my $self = shift;
2426     my $commithash = shift;
2428     die("Need commithash") unless ( defined($commithash) and $commithash =~ /^[a-zA-Z0-9]{40}$/ );
2430     my $db_query;
2431     $db_query = $self->{dbh}->prepare_cached("SELECT value FROM commitmsgs WHERE key=?",{},1);
2432     $db_query->execute($commithash);
2434     my ( $message ) = $db_query->fetchrow_array;
2436     if ( defined ( $message ) )
2437     {
2438         $message .= " " if ( $message =~ /\n$/ );
2439         return $message;
2440     }
2442     my @lines = safe_pipe_capture("git-cat-file", "commit", $commithash);
2443     shift @lines while ( $lines[0] =~ /\S/ );
2444     $message = join("",@lines);
2445     $message .= " " if ( $message =~ /\n$/ );
2446     return $message;
2449 =head2 gethistory
2451 This function takes a filename (with path) argument and returns an arrayofarrays
2452 containing revision,filehash,commithash ordered by revision descending
2454 =cut
2455 sub gethistory
2457     my $self = shift;
2458     my $filename = shift;
2460     my $db_query;
2461     $db_query = $self->{dbh}->prepare_cached("SELECT revision, filehash, commithash FROM revision WHERE name=? ORDER BY revision DESC",{},1);
2462     $db_query->execute($filename);
2464     return $db_query->fetchall_arrayref;
2467 =head2 gethistorydense
2469 This function takes a filename (with path) argument and returns an arrayofarrays
2470 containing revision,filehash,commithash ordered by revision descending.
2472 This version of gethistory skips deleted entries -- so it is useful for annotate.
2473 The 'dense' part is a reference to a '--dense' option available for git-rev-list
2474 and other git tools that depend on it.
2476 =cut
2477 sub gethistorydense
2479     my $self = shift;
2480     my $filename = shift;
2482     my $db_query;
2483     $db_query = $self->{dbh}->prepare_cached("SELECT revision, filehash, commithash FROM revision WHERE name=? AND filehash!='deleted' ORDER BY revision DESC",{},1);
2484     $db_query->execute($filename);
2486     return $db_query->fetchall_arrayref;
2489 =head2 in_array()
2491 from Array::PAT - mimics the in_array() function
2492 found in PHP. Yuck but works for small arrays.
2494 =cut
2495 sub in_array
2497     my ($check, @array) = @_;
2498     my $retval = 0;
2499     foreach my $test (@array){
2500         if($check eq $test){
2501             $retval =  1;
2502         }
2503     }
2504     return $retval;
2507 =head2 safe_pipe_capture
2509 an alterative to `command` that allows input to be passed as an array
2510 to work around shell problems with weird characters in arguments
2512 =cut
2513 sub safe_pipe_capture {
2515     my @output;
2517     if (my $pid = open my $child, '-|') {
2518         @output = (<$child>);
2519         close $child or die join(' ',@_).": $! $?";
2520     } else {
2521         exec(@_) or die "$! $?"; # exec() can fail the executable can't be found
2522     }
2523     return wantarray ? @output : join('',@output);
2527 1;