- 追加された行はこの色です。
- 削除された行はこの色です。
[[授業/H25/系統解析論]]
**memo [#y127f6b2]
***Problem in Mac OSX sed: [#g09c5811]
**Problem in Mac OSX sed: [#g09c5811]
$ curl -O http://ftp.jaist.ac.jp/pub/GNU/sed/sed-4.2.tar.gz
$ tar xzf sed-4.2.tar.gz
$ cd sed-4.2
$ ./configure --with-libiconv-prefix=/usr --with-libintl-prefix=/usr
$ make
$ sudo make install
**sed script to convert TinyXML format to flat tab-delimited format [#s7eada5d]
#tinyxml.sed
#最初の3行と空白行、削除
/<?/d
/<\!DOC/d
/ <TSeqSet>/d
/^$/d
#ループ指定
:loop1
#1データの最初の2行は削除
/<TSeq>/d
/<TSeq_seqtype/d
#最初のフィールド読み混み空白から始まる開始タグを削除
s/ \+<[^>]\+>//
#2行目を読み混み
N
#終止タグと改行と空白に続く次の行の開始タグを削除
s/<\/[^/]\+>\n \+<[^>]\+>/\t/
#1データの最後のタグを削除したら、パターンを吐き出し最初へ。置換がおきなければloop1へ戻る
s/<\/TSeq_sequence>\n<\/TSeq>//
t loop1
/<\/TSeqSet>/d
P
D
***fields delimited by tab [#q7e4f04d]
gi accver taxid orgname defline length sequence