Yearly Archives: 2010

2010-04-24

Meadow上でMagitを使う設定(git-encwrapper使用)

言語まわりの方針・設定はこの前のままで。

.emacs

; *Meadowとgitとの間はutf-8にする。
;  コミットログをutf-8で記録したい。
;  i18n.commitEncodingはコミット時に変換してくれるわけではないっぽい。
;  また、magit.el内でgit log --format %sを使っている場所があるので、
;  どうしてもutf-8でやりとりせざるを得ない。
;  この設定はshell-file-name経由でgitを呼ぶ場合には適用されないので注意。
(modify-coding-system-alist 'process "git" '(utf-8-dos . utf-8-unix))

; magitを使えるようにする。
(cond ((locate-library "magit")
       (require 'magit)

       ;; git diffとgit applyの文字エンコーディングを
       ;; .gitattributesのencoding属性に合わせて調整するラッパーを使う。
       ;; git-encwrapperをコンパイルしてパスの通ったところに置くこと。
       (setq magit-git-executable "git-encwrapper")

       ;; magitがshell-file-name(sh.exe)経由でgitを呼ぶとき、utf-8で入出力する。
       ;; magitがshell-file-nameを使ってprocess-fileやcall-processする関数には次のものがある(magit-0.7では)。
       ;; - magit-shell-command-to-string
       ;; - magit-git-exit-code
       ;; - magit-run-shell
       ;; これらの呼び出し時、一時的にprocess-coding-system-alistを書き換える。
       ;;
       ;; shに対するprocess-coding-system-alistをutf-8にしている人は不要。
       (defun add-sh-utf8-process-coding-system-alist ()
         (cons (cons shell-file-name '(utf-8-dos . utf-8-unix)) process-coding-system-alist))

       (defadvice magit-shell-command-to-string (around magit-shell-command-to-string-proc-coding activate)
         (let ((process-coding-system-alist (add-sh-utf8-process-coding-system-alist)))
           ad-do-it))

       (defadvice magit-git-exit-code (around magit-git-exit-code-proc-coding activate)
         (let ((process-coding-system-alist (add-sh-utf8-process-coding-system-alist)))
           ad-do-it))

       (defadvice magit-run-shell (around magit-run-shell-proc-coding activate)
         (let ((process-coding-system-alist (add-sh-utf8-process-coding-system-alist)))
           ad-do-it))

 ))

2010-07-07追記: magit-0.8.1ではshell-file-name経由でgitを呼ぶ箇所は無くなったので、上記のdefun~defadvice部分は削除してよい。

2010-04-24

エンコーディングを調整するラッパーを使ってMeadow上のMagitで部分的なstage(apply)をする

2013-08-12追記: elisp側で何とかするコードを書きました。複数の文字符号化方式が混在しているときのmagit文字化け対策コード

結局gitのラッパーを書いた。git-encwrapper(GitHubを初めて利用してみた)。

このラッパーは標準入出力を通過するパッチテキストのファイルヘッダーを認識して、ファイル名に対応するgitattributesのencoding属性を取得し、そのエンコーディングを元に、パッチテキストのファイル内容部分を再エンコードする。

このラッパーのおかげで、エンコーディングを統一するためにexternal diffとnkfを使う必要はなくなった。ただ、nkfのように自動でエンコーディングを判定しないので、.gitattributesファイルに「*.txt encoding=utf-8」のように記述しないといけない。

apply時にはdiffの逆変換を行うので、Magitが(エンコーディングが)統一されたdiffの出力を元に部分適用のパッチを作成して(標準入力経由で)gitに送り返してきても、先にラッパーが(エンコーディングが)バラバラの状態に戻すので、gitは正しくパッチを適用することが出来る。

これで、今度こそようやくまともに使えるようになったと思う。マージ操作のやり方とかまだ学んでいないから、また動かないケースに遭遇するかもしれないけど……。

それにしても、何でこんなに苦労しなければならないのかさっぱり分からない。Meadow、Emacs、Windows、Linux、どこで使うにしてもいろいろな文字エンコーディングを柔軟に使いたい場合、素のgitでは使い物にならないと思う。こういう要求ってそれほど特殊なのものだろうか? 誰も気がつかないはず無いんだけど。現にgit-guiではそれなりに対応しているわけだし。git自体にエンコーディングに関する処理を入れたくない方針なのであれば(ログについてはすでに処理してるけどね。それも中途半端に)、git-cui(guiではなく)みたいなフロントエンドが必要なんじゃないんだろうか。私が知らないだけで、すでに何らかの対処がされていてもおかしくないと思う。いや、そうであってほしい。

2010-04-20

Magitからstageに失敗する 日本語編

うーん、やっぱりexternal diffでnkfをかけているせいで、日本語部分の部分的なstageがうまくいかない。どうすれば良いんだろう。

gitはファイル毎に文字エンコーディングメタ情報を持って、適切に変換処理を行うべきだと思うんだけど、その辺はどうなってるのよ。

git-guiだと.git/info/attributesに「ファイル名 encoding=utf-8」みたいに書けば適切に表示してくれるようになっている(gitattributes(5) Manual Page)。また、.gitconfigのgui.encodingによって、デフォルトの解釈も指定できる。でもさ、これってguiの問題なのかね? コマンドラインで表示するときだって、適切に変換してエンコーディングを統一してから標準出力へ流すべきなんじゃないの?

まあとにかく、gitの方でやってくれないのであれば、magitの方で何とかしないといけないんだろうな。

2010-04-19

Magitの分からない操作

Magitってファイル単位のログを表示する方法って用意されていないよね? そもそも管理対象のファイル一覧を出す方法もないよね? そのあたりはpcl-cvsとかpsvnとかの方が扱いやすいなぁ。

ログくらいeshellから表示すれば良いんだろうけど。eshellじゃなくshellの方だと、またprocess-coding-system-alistを何とかしないといけない。

あ、試しているのはmagit-0.7.tar.gzだから、最新の状況は分からないけど。

2010-04-19

Magitからstageに失敗する

むむ、部分的にstageしようとしたらtrailing whitespaceがどうとかでパッチが適用できないと言われた。gitに渡る標準入力の行末コードとファイルの行末コードが一致しないのだろう。

この前の設定を次のように修正したらうまくいった。

-(modify-coding-system-alist 'process "git" '(utf-8 . utf-8))
+(modify-coding-system-alist 'process "git" '(utf-8-dos . utf-8-unix))

-       (defun add-sh-utf8-process-coding-system-alist ()
-	 (cons (cons shell-file-name '(utf-8 . utf-8)) process-coding-system-alist))
+       (defun add-sh-utf8-process-coding-system-alist ()
+	 (cons (cons shell-file-name '(utf-8-dos . utf-8-unix)) process-coding-system-alist))
2010-04-19

健康を取り戻せ

もっと健康にならなければならないと思う。どうも三月の惨状以来、体の活性が上がりにくくなった気がする。

もっと体を動かしたいのだが、平日はなかなかできない。いや、やろうと思えばできるのだが、平日は仕事に集中する日、という制限を取り払いたくはない。結局できるのは行き帰りの自転車通勤くらいのものだ。

2010-04-16

Meadow3からgitを使う時の設定メモ

なんとかまともに使えそうな設定が見つかったのでメモ。

条件:

  • CygwinはUTF-8ではなくCP932で使う(LANG=ja_JP.CP932)。CygwinからほかのWindows用コマンドラインツールを呼び出したりするので、CygwinのツールだけUTF-8になっても困る。
  • msysgitを使う。Cygwinのgitはテキストモードのディレクトリで使えないので。Cygwinのcvsを使う以上、開発用ディレクトリ全体をテキストモードにする必要がある。cvsを使うかgitを使うかでプロジェクトごとにマウントし直すのは嫌。
  • Cygwinのsshを使う。win-ssh-askpassを使いたいので、msysgitのsshを使うわけにはいかない。
  • コミットログはUTF-8で記録したい。i18n.commitEncodingではダメ。これはUTF-8に変換してくれるわけではない。
  • Meadow上ではMagitを使う。
  • Magitからできるだけ文字化けしないようにしたい。
    • エンコーディングが違うファイル(たとえば一方はUTF-8、もう一方はCP932)の差分を文字化けせずに同時に表示したい。git diffの中で混ざってしまうので、結果をどう加工しても回避できない。
    • バッファ上部に出る最後のコミットのタイトルが文字化けしないようにしたい。magit-shell-command-to-string、magit-git-exit-code、magit-run-shell関数はsh.exe(shell-file-name)経由でgitを呼び出すので、modify-coding-system-alistでgit.exeのエンコーディングを指定しただけでは不十分。
    • Unpushed一覧などで文字化けしないようにしたい。git log –pretty:formatの%sではi18n.logOutputEncodingが効かない模様。

以上を考慮すると、Meadow-git間はutf-8にするのが無難。

cp932にしていろいろ試してみたのだけれど、git logのformatで%sを使った場合にlogOutputEncodingを考慮してくれない(gitにログをcp932で出力させられない)というところでギブアップ。magit-insert-unpushed-commitsなどがこのフォーマット指定を使っている。

utf-8にすると、今度はsh経由でgitを呼び出す部分で困る。sh経由でほかのツールを呼び出すこともあるので、shのエンコーディングを一律utf-8にするわけにはいかない。仕方ないので、defadviceでごにょごにょした。

msysgitの中で無効化するファイル。Cygwinのを使うので、削除するなり移動するなり。

  • bin/ssh*
  • bin/bash

.bashrcの関係ありそうな部分。

export TMP=/tmp
export TEMP=/tmp
export LANG=ja_JP.CP932

.emacsの関係ありそうな部分。

; *環境変数の設定。これらをシステム全体の設定にするのは抵抗があるのでここで。
;  Cygwin1.7の動作とか、win-ssh-askpassの動作とかで問題になったものを列挙。
(setenv "LANG" "ja_JP.CP932")
(setenv "TMP" "c:/app/cygwin/tmp") ;Meadowを使っている間はCygwinの/tmpを使う。
(setenv "TEMP" "c:/app/cygwin/tmp") ;Meadowを使っている間はCygwinの/tmpを使う。

; *とりあえず日本語環境が前提。
(set-language-environment "Japanese")

; *magit.elはgitを直接起動することもあるし、shell-file-nameのコマンド経由で起動することもあるので注意。
(setq shell-file-name "sh")
(setq shell-command-switch "-c") 

; *私はMeadow-Cygwin間は基本的にcp932にしている。
;  ほとんどの自作コマンドラインツールがcp932前提だし、
;  日本語版Windowsのデフォルトのロケールはcp932なわけだから、
;  Cygwin以外のWindows用ツールと連携させるならば普通はこの方がいい。
(modify-coding-system-alist 'process "sh" '(cp932-dos . cp932-unix))

; *Meadowとgitとの間はutf-8にする。
;  コミットログをutf-8で記録したい。
;  i18n.commitEncodingはコミット時に変換してくれるわけではないっぽい。
;  また、magit.el内でgit log --format %sを使っている場所があるので、
;  どうしてもutf-8でやりとりせざるを得ない。
;  この設定はshell-file-name経由でgitを呼ぶ場合には適用されないので注意。
;  そちらは.gitconfigのi18n.logOutputEncodingと、sh.exeに対する
;  process-coding-system-alistの設定で調整すること。
(modify-coding-system-alist 'process "git" '(utf-8-dos . utf-8-unix))

; magitを使えるようにする。
(cond ((locate-library "magit")
       (require 'magit)
       ;; magitがshell-file-name(sh.exe)経由でgitを呼ぶとき、utf-8で入出力する。
       ;; magitがshell-file-nameを使ってprocess-fileやcall-processする関数には次のものがある。
       ;; - magit-shell-command-to-string
       ;; - magit-git-exit-code
       ;; - magit-run-shell
       ;; これらの呼び出し時、一時的にprocess-coding-system-alistを書き換える。
       (defun add-sh-utf8-process-coding-system-alist ()
         (cons (cons shell-file-name '(utf-8-dos . utf-8-unix)) process-coding-system-alist))

       (defadvice magit-shell-command-to-string (around magit-shell-command-to-string-proc-coding activate)
         (let ((process-coding-system-alist (add-sh-utf8-process-coding-system-alist)))
           ad-do-it))

       (defadvice magit-git-exit-code (around magit-git-exit-code-proc-coding activate)
         (let ((process-coding-system-alist (add-sh-utf8-process-coding-system-alist)))
           ad-do-it))

       (defadvice magit-run-shell (around magit-run-shell-proc-coding activate)
         (let ((process-coding-system-alist (add-sh-utf8-process-coding-system-alist)))
           ad-do-it))

 ))

.gitconfig

[diff]
	external = ~/git-diff-nkf.sh
#[i18n]
#	logOutputEncoding = utf-8

~/git-diff-nkf.sh (異なる文字エンコーディングで書かれたファイルの差分をUTF-8に統一するために必要。echoの部分はちょっと怪しい。モード値だけが変わった場合にどうなるのかとかよくわかっていない)

#!/bin/sh
# $1 = 比較しているファイルのファイル名
# $2 = 旧バージョンの内容が入ったテンポラリファイル名
# $3 = 旧バージョンの内容のオブジェクト名
# $4 = 旧バージョンのファイルのモード値
# $5 = 新バージョンの内容が入ったテンポラリファイル名
# $6 = 新バージョンの内容のオブジェクト名
# $7 = 新バージョンのファイルのモード値

echo diff --git a/$1 b/$1
if test $3 == "."
then
# *新しくファイルを追加するとき。
# 例:
# diff --git a/.gitignore b/.gitignore
# new file mode 100644
# index 0000000..b25c15b
# --- /dev/null
# +++ b/.gitignore
    echo new file mode $7
    echo index 0000000..${6:0:7}
    diff -u -L /dev/null -L b/$1 $2 $5 | nkf --utf8 -d
else
# *内容が変わった場合。
# 例:
# diff --git a/readme.txt b/readme.txt
# index 353a8aa..401f140 100644
# --- a/readme.txt
# +++ b/readme.txt
    echo index ${3:0:7}..${6:0:7} $7
    diff -u -L a/$1 -L b/$1 $2 $5 | nkf --utf8 -d
fi

2010-04-24追記:上の方法は選択範囲(日本語を含む)を部分的にstageする機能が正しく動かない場合がある。それに対処するためエンコーディング調整ラッパーを使う方法を書いた。これを使うと.gitconfigとgit-diff-nkf.shは不要。