ヽ(´ー`)ノ
2004-06-01 [長年日記]
♭ [P] 雨
(00:12) 著者にはいっていないのに、author-list なメール宛のメールがきたのはなぜ?
(08:35) ひどい雨ですね。
(17:00) 予約とったり。16:00 - 19:00。
(21:30) 紅白の横断幕があったり、「だるま」がでてきたり。yk さんがいたり、写真うつりいいねといって殴られたり。
♭ [Bio] 毎日新聞 理系白書 記者ノート:小柴プロジェクトと和田プロジェクト 瀬川至朗
加藤紘一議員が小柴昌俊・東京大名誉教授と、和田昭充・理化学研究所ゲノム科学総合研究センター特別顧問(東京大名誉教授)に研究プロジェクトの成功と失敗について衆議院文部科学委員会で聞いたというはなし。 第159回国会5月26日文部科学委員会の動き の質疑事項「1.小柴プロジェクト(ニュートリノ検出等)と和田プロジェクト(ゲノム解析等)に対しての政策判断についての両参考人の見解」ですな。議事録はまだのようである。
♭ [Bio][eTOCs] peds
- How does a topological inversion change the evolutionary constraints on membrane proteins?
- Hisako Ichihara, Hiromi Daiyasu, and Hiroyuki Toh Protein Engineering, Design and Selection 2004 17: 235-244.
♭ [Mac] ウェブページの画像をとりたい
と調べると、Webnail2 - WEBページサムネイル画像作成ツール にたどりつき、Webnail AppleScript にたどり着いた。しかし Camino が必要ですか。こちら では RubyCocoa で試している方がいらっしゃいますが、未完成ぽい。
2004-06-02 [長年日記]
♭ [P]
(10:00) おもわず、息を飲んだ。
(17:13) ID トークンがきた。
(18:40) Users のバックアップでもしようか。
(21:30) そのとき、わなわなしていることに気がついた。まあ、もちつけ。
♭ [Bio][eTOCs] Genome Biol. 5(6)
Software
- TXTGate: profiling gene groups with text-based information, Patrick Glenisson, Bert Coessens, Steven Van Vooren, Janick Mathys, Yves Moreau, Bart De Moor
- NLP っぽい。
♭ [Bio][eTOCs] Genome Res 14(6)
Articles
- Genomic Regionality in Rates of Evolution Is Not Explained by Clustering of Genes of Comparable Expression Profile Martin J. Lercher, Jean-Vincent Chamary, and Laurence D. Hurst, Genome Res. 2004;14 1002-1013
Letters
- Coexpression of Neighboring Genes in the Genome of Arabidopsis thaliana Elizabeth J.B. Williams and Dianna J. Bowles, Genome Res. 2004;14 1060-1067
- アラビド。
- Coexpression Analysis of Human Genes Across Many Microarray Data Sets Homin K. Lee, Amy K. Hsu, Jon Sajdak, Jie Qin, and Paul Pavlidis, Genome Res. 2004;14 1085-1094
- ヒト。
Methods
- Building Genomic Profiles for Uncovering Segmental Homology in the Twilight Zone Cedric Simillion, Klaas Vandepoele, Yvan Saeys, and Yves Van de Peer, Genome Res. 2004;14 1095-1106
- Visualizing Sequence Similarity of Protein Families Vamsi Veeramachaneni and Wojciech Makalowski, Genome Res. 2004;14 1160-1169
- Predicting Protein Complex Membership Using Probabilistic Network Reliability Saurabh Asthana, Oliver D. King, Francis D. Gibbons, and Frederick P. Roth, Genome Res. 2004;14 1170-1175
Resources
- WebLogo: A Sequence Logo Generator Gavin E. Crooks, Gary Hon, John-Marc Chandonia, and Steven E. Brenner, Genome Res. 2004;14 1188-1190
-
DNA とアミノ酸配列のシーケンスロゴ生成 cgi。MIT open source ライセンスでソース公開。
- WebLogo - <URL:http://weblogo.berkeley.edu/>
- WebLogo - Examples <URL:http://weblogo.berkeley.edu/examples.html>
- eShadow: A Tool for Comparing Closely Related Sequences Ivan Ovcharenko, Dario Boffelli, and Gabriela G. Loots, Genome Res. 2004;14 1191-1198
♭ [Bio][Bi] 東京大学 バイオインフォマティクス集中講義 監修 高木利久 羊土社
ざっとみたところ、目次をみたときの印象とことなり、それぞれの担当著者や出版社のおもいに温度差や方向性の差があり、興味深いです。
たとえば、概論に留まっている章があるいっぽうで、具体的な数式を展開している章があったりします。 用語解説が脚注になっているのは、教科書としては好ましい体裁であるとおもいます。
しかし、著者ごとに方向性のことなりが、用語解説で同じ概念を指しているけど見出し語がちがう(p31とp79の脚注参照)などの不統一を醸しだしているようです。 とはいえ、これは単なる編集の問題なのかもしれません。
2004-06-03 [長年日記]
♭ [Hoge] 今日の某マシン
top - 16:06:09 up 6 days, 21:59, 4 users, load average: 1.16, 1.10, 1.03 Tasks: 55 total, 2 running, 53 sleeping, 0 stopped, 0 zombie Cpu(s): 0.0% user, 54.0% system, 0.0% nice, 46.0% idle Mem: 515548k total, 512432k used, 3116k free, 196k buffers Swap: 489972k total, 248132k used, 241840k free, 2276k cached PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ Command 25928 n 16 0 492m 483m 191m D 26.7 96.1 86:02.94 ruby
切なくなってきました。 kswapd が介入し始めております。
♭ [OS] Screen Glossary
Screen のネタ帳な Wiki。
2004-06-04 [長年日記]
♭ [P] 晴れ

(07:15) 目が覚めた。
(12:49) 「イケイケじゃないんですか?」と聞くと、「いやいや」と同時に返答。そういわれてもねー。
(13:26) 研究出会い系があったらいいね、という話。
(21:30) good bye my master を聞いてて、こみ上げてきた。
♭ [Bio] 第159回国会 文部科学委員会 第22号(平成16年5月26日(水曜日))
アップロードされていた。
♭ [Bio] 第6回 日本進化学会 東京大会
08/04-04に東大駒場キャンパスにて開催。 6月中は参加費早期割引。 ISMBとちょと重なるのが残念なところ。
2004-06-05 [長年日記]
♭ [P]
(01:59) lib/bio/appl/psort.rb の更新版を探しまわったりしたり。
(15:30) 今日明日は埼京線の工事があるのですね。
(16:20) 都民税区民税通知きたー。
(18:10) 区長選挙運動がにぎやかな夕暮れ。
(18:30) 電話で呼び出され系。 ガーデンプレイスで彫刻をみつつ。
♭ [BioRuby] lib/bio/appl/psort.rb の更新一歩前
con = Bio::PSORT::PSORT1.imsut #東大医科研のサーバに接続 parsed_report = con.exec(Bio::FastaFormat.new(faa)) # 問い合わせ(1) text_report = con.exec(Bio::FastaFormat.new(faa), false) # 問い合わせ(2) parsed_report == Bio::PSORT::PSORT1::Report.new(text_report) # 返り血の違い
あとは、Bio::PSORT::PSORT2#exec にも Bio::FastaFormat を理解させることとドキュメントの整備。
2004-06-09 [長年日記]
♭ [P] whoin、健康診断、チケット
(01:20) whoin を直したよ。
(14:36) なんかエラーになることがあるな。
(15:30) 健康診断。
(17:19) チケットの諸書類依頼。 クロネコで発送とのこと。
(18:30) 雨雨雨
♭ [Bio] whoin.hgc.jp
ゲノムひろば2003のためにつくったものを、スパコンに移植したら、一部うまく動いていなかったから、修正していた。 ヒトのタンパク質配列にふくまれる任意のアミノ酸配列を検索するもので、いちぶ不評だったけど、いちぶで好評だったりしたりしなかったり。
検索は、MySQL の like 検索だけど、わりとレスポンスは良好だった(同業者に好評)。 が、MySQL をスパコンに移すと、なぜか悪くなった。
うまく動かなかったのは、ソケットを規定値以外に設定したサーバに接続しないといけないのだが、それをクライアントに反映していなかったのが理由。 Mysql.new(host, user, pass, port, sock) の sock を設定すると ruby-mysql で正常につかえたり。
2004-06-10 [長年日記]
♭ [Bio][eTOCs] J. Proteome Res.
- Multidimensional Protein Profiling Technology and Its Application to Human Plasma Proteome Kiyonaga Fujii, Tomoyo Nakano, Takeshi Kawamura, Fumihiko Usui, Rong Wang, and Toshihide Nishimura
- オルガネラプロテオーム系。LC/MS/MS を使用。診断目的っぽい。plasma proteome だから、オルガネラというよりは組織プロテオームというべきか。
2004-06-11 [長年日記]
♭ [P] 敗北、Tセミナ、チケット、250円

(01:10) なんかすこし回復
(11:21) ものの名前が思い出せない。
(16:16) 航空券まできた。
(19:30) いってみた。 けど、放談にはまだ若すぎると思いつつ。
(21:40) あめだよ。
♭ [Bio] Gene Ontology Tools がキャッチーになっている
アイコンがついたよ。 bio/db/go.rb は更新してから、ということでよろしこ。
cvs ci go.rb してみた。極マイナーな修正だけですが。
2004-06-13 [長年日記]
♭ [BioRuby] psort.rb と psort/report.rb を ci
- cgi クライアントのリファクタリング。Bio::PSORT::CGIDriver をスーパークラスにする。継承したクラスのなかで、make_args と parse_report メソッドを作るだけで良い程度に分離。
- Bio::PSORT::PSORT[12]#title の値を Bio::PSORT::PSORT[12]::Report#entry_id に渡すようにした。psort2 の cgi は問い合わせの配列名を返さないのがひどい。
CGIDriver の使い方
class Hoge
class Remote < CGIDriver
def initialize(host, path)
super(host, path)
end
private
def make_args(query) # exec ごとに変更される引数の設定
@args.update({'hoge' => query})
return arg_join(@args)
end
def parse_report(str) # cgi からの返り値の処理
str = Hoge::Report.new(str) if @parsing
return str
end
end
end
serv = Hoge::Remote.new(host, path)
serv.args = {'hgoe' => 'fuga', 'hogehoge' => 'gaga'} # ほぼ一定な引数の設定
serv.parsing = true # cgi からの返り血の処理の有無
report = serv.exec(query)
もうすこし整理できそうな気がする。
2004-06-14 [長年日記]
♭ [P] 届く、

(01:26) 畳に座りつづけると 背骨が痛む 椅子持ち帰ろうかな
(10:40) に不在だったらしい。 夜間便(19:00-20:00)で再配達設定。
(20:07) 到着。 開けてから気がつく。 これも何かの縁だろう。
♭ [Bio] SPiD - Subtils Protein interaction Database
inra.fr で開発している枯草菌のタンパク質相互作用データベース。 GraphViz で可視化している。 (from bioperl-l)
♭ [RRb] [RAA:ruby-rmathlib] の更新
更新ボタンを押してみた。 パスフレーズの更新もしたみたい。
2004-06-15 [長年日記]
♭ [P] 徒歩、GO database、はじめての某
(00:41) 真夜中のイタリアン。
(09:24) なんとなく歩いて恵比寿駅までいく。
(14:58) make だとなぜかうまく行かない。(--;
(20:10) 目黒ファイナンシャルセンターのまわりに消防車が何台も止まってるし、歩道が規制されて歩けないし。
(22:16) がーん。 みてしまった。
♭ [Bio][eTOCs] PLoS Biology
- Integrative Analysis of the Mitochondrial Proteome in Yeast
-
Holger Prokisch, Curt Scharfe, David G. Camp, II., Wenzhong Xiao, Lior David, Christophe Andreoli, Matthew E. Monroe, Ronald J. Moore, Marina A. Gritsenko, Christian Kozany, Kim K. Hixson, Heather M. Mottaz, Hans Zischka, Marius Ueffing, Zelek S. Herman, Ronald W. Davis, Thomas Meitinger, Peter J. Oefner, Richard D. Smith, Lars M. Steinmetz
ミトコンドリア・プロテオーム。
- Integrative Annotation of 21,037 Human Genes Validated by Full-Length cDNA Clones
-
Tadashi Imanishi, Takeshi Itoh, Yutaka Suzuki, Claire O'Donovan, Satoshi Fukuchi, Kanako O. Koyanagi, Roberto A. Barrero, Takuro Tamura, Yumi Yamaguchi-Kabata, Motohiko Tanino, Kei Yura, Satoru Miyazaki, Kazuho Ikeo, Keiichi Homma, Arek Kasprzyk, Tetsuo Nishikawa, Mika Hirakawa, Jean Thierry-Mieg, Danielle Thierry-Mieg, Jennifer Ashurst, Libin Jia, Mitsuteru Nakao, Michael A. Thomas, Nicola Mulder, Youla Karavidopoulou, Lihua Jin, Sangsoo Kim, Tomohiro Yasuda, Boris Lenhard, Eric Eveno, Yoshiyuki Suzuki, Chisato Yamasaki, Jun-ichi Takeda, Craig Gough, Phillip Hilton, Yasuyuki Fujii, Hiroaki Sakai, Susumu Tanaka, Clara Amid, Matthew Bellgard, Maria de Fatima Bonaldo, Hidemasa Bono, Susan K. Bromberg, Anthony J. Brookes, Elspeth Bruford, Piero Carninci, Claude Chelala, Christine Couillault, Sandro J. de Souza, Marie-Anne Debily, Marie-Dominique Devignes, Inna Dubchak, Toshinori Endo, Anne Estreicher, Eduardo Eyras, Kaoru Fukami-Kobayashi, Gopal R. Gopinath, Esther Graudens, Yoonsoo Hahn, Michael Han, Ze-Guang Han, Kousuke Hanada, Hideki Hanaoka, Erimi Harada, Katsuyuki Hashimoto, Ursula Hinz, Momoki Hirai, Teruyoshi Hishiki, Ian Hopkinson, Sandrine Imbeaud, Hidetoshi Inoko, Alexander Kanapin, Yayoi Kaneko, Takeya Kasukawa, Janet Kelso, Paul Kersey, Reiko Kikuno, Kouichi Kimura, Bernhard Korn, Vladimir Kuryshev, Izabela Makalowska, Takashi Makino, Shuhei Mano, Regine Mariage-Samson, Jun Mashima, Hideo Matsuda, Hans-Werner Mewes, Shinsei Minoshima, Keiichi Nagai, Hideki Nagasaki, Naoki Nagata, Rajni Nigam, Osamu Ogasawara, Osamu Ohara, Masafumi Ohtsubo, Norihiro Okada, Toshihisa Okido, Satoshi Oota, Motonori Ota, Toshio Ota, Tetsuji Otsuki, Dominique Piatier-Tonneau, Annemarie Poustka, Shuang-Xi Ren, Naruya Saitou, Katsunaga Sakai, Shigetaka Sakamoto, Ryuichi Sakate, Ingo Schupp, Florence Servant, Stephen Sherry, Rie Shiba, Nobuyoshi Shimizu, Mary Shimoyama, Andrew J. Simpson, Bento Soares, Charles Steward, Makiko Suwa, Mami Suzuki, Aiko Takahashi, Gen Tamiya, Hiroshi Tanaka, Todd Taylor, Joseph D. Terwilliger, Per Unneberg, Vamsi Veeramachaneni, Shinya Watanabe, Laurens Wilming, Norikazu Yasuda, Hyang-Sook Yoo, Marvin Stodolsky, Wojciech Makalowski, Mitiko Go, Kenta Nakai, Toshihisa Takagi, Minoru Kanehisa, Yoshiyuki Sakaki, John Quackenbush, Yasushi Okazaki, Yoshihide Hayashizaki, Winston Hide, Ranajit Chakraborty, Ken Nishikawa, Hideaki Sugawara, Yoshio Tateno, Zhu Chen, Michio Oishi, Peter Tonellato, Rolf Apweiler, Kousaku Okubo, Lukas Wagner, Stefan Wiemann, Robert L. Strausberg, Takao Isogai, Charles Auffray, Nobuo Nomura, Takashi Gojobori, Sumio Sugano
H-Invitational の論文。<URL:http://h-invitational.jp>。
♭ [Bio] godatabase.org の Example SQL
これが面白い。
インストールログ
README をダウンロードして読む。
$ curl -O http://www.godatabase.org/dev/database/archive/latest/README $ less README
いくつか選択できるが、遺伝子産物の配列付きデータをダウンロード。166MBほど。解凍すると637MBくらい。
$ curl -O http://www.godatabase.org/dev/database/archive/latest/go_200405-seqdb-tables.tar.gz $ tar ztvf go_200405-seqdb-tables.tar.gz $ tar zxvf go_200405-seqdb-tables.tar.gz $ cd go_200405-seqdb-tables
データベース go を作成。
$ echo "CREATE DATABASE go;" | mysql -uroot -p
テーブルを作成。
$ cat *.sql | mysql -uroot -p go
データをインポート。しばし時間がかかる。このスキに原稿をすすめる(ぉ。
$ mysqlimport -uroot -p -L go *.txt
おしまい。
そして、Example SQL で遊ぶという流れで。
2004-06-16 [長年日記]
♭ [P]セレノタンパク質
(00:10) Music と Pictures を完全移行。
(01:37) お盆の計画を練ったり。
(10:31) Odo 354.9, Dst 3.88, Tm 0.19.01, Av 12.2, Mx 29.6。
(18:30) タイヤに空気いれたら軽くなった。
(22:25) 3,523以下。含む238文字。
(22:49) 誘われる。やぶさかではないが、しかし、だがしかし。
♭ [Bio] Stag - Structured Tag Library
テンプレートでマッピングするしかけ。 おもわず、奥が深いといいそうになってしまった。
同じ名前のSTAG - Search Texts in All over the GenomeNet は更新されつづけているようです。
♭ [Bio] GO Database June 2004 Release
昨日 200405 をインストールしたのに。orz (from go-database ML)
♭ [Hoge] qmail-send program さまからメールです。
Subject: failure notice From: MAILER-DAEMON@**mail**.yokohama.*****.**.jp Date: 16 Jun 2004 22:57:08 +0900 Hi. This is the qmail-send program at **mail**.yokohama.*****.**.jp. I'm afraid I wasn't able to deliver your message to the following addresses. This is a permanent error; I've given up. Sorry it didn't work out. <****@***.*****.**.jp>: Sorry, no mailbox here by that name. vpopmail (#5.1.1)
Return-Path を偽装されているようなので、どうしようもないのだろうか。
2004-06-17 [長年日記]
♭ [P] 曇り、月例
(00:17) まだ降り込まれてなーい。
(11:48) MR 作成中にログをみるわけだけど、ひと月すぎたことを改めて確認する。
(12:34) クリエイティブな仕事についているひとから、著作権違反を積極的に邁進したい旨のことがでてくるとは閉口してしまう。
(12:43) KNOB が話題になったり。
(15:39) 香ばしいことになりつつありつつ。
♭ [Bio] Programme Available: The Seventh Annual Bio-ontologies Meeting
ISMB/ECCB2004 のサテライトミーティングのひとつ Bio-Ontology のプログラムが公開されました。 日本からは福田さん@CBRCが発表されます。
♭ [Bio] ISMB 2006 はブラジルです。
Fortaleza は赤道直下です。
♭ [Bio][eTOCs] NAR
Survey and Summary
- How do site-specific DNA-binding proteins find their targets?
- Stephen E. Halford and John F. Marko Nucl. Acids. Res. 2004 32: 3040-3052.
Articles
- Sequence-specific Rho-RNA interactions in transcription termination
-
James E. Graham Nucl. Acids. Res. 2004 32: 3093-3100.
ρ因子。
- PeerGAD: a peer-review-based and community-centric web application for viewing and annotating prokaryotic genome sequences
-
Mark D. D'Ascenzo, Alan Collmer, and Gregory B. Martin Nucl. Acids. Res. 2004 32: 3124-3135.
バクテリアゲノム配列のコミュニティーアノテーションシステム。
- RNAProfile: an algorithm for finding conserved secondary structure motifs in unaligned RNA sequences
-
Giulio Pavesi, Giancarlo Mauri, Marco Stefani, and Graziano Pesole, Nucl. Acids. Res. 2004 32: 3258-3269.
アラインメントなしに保存された二次構造モチーフを検索する。
♭ [Mac] IRCStep.app
MacOS X / OPENSTEP用IRCクライアント。 アイコンがカッコイイ。
2004-06-18 [長年日記]
♭ [P] H2AS会議
(01:09) 意外なCDが、インナーイヤーのヘドホンではわかりえないくらい情報量が多めだったりするものですね。きっと、購入したひとの大部分はそれを知らずに人生を全うしてしまうことでしょう。
(18:41) 某許諾確保
(23:20) ぎゃー。みつけてしまった。
♭ [Mac] iCal Library - Japan Holidays
なにげに、iCal.app で [カレンダー]→[カレンダーライブラリを表示...] を選択すると、そこにはさまざまな祝日だけでなく、F1とかNBLとかのカレンダーがあったのだった。apple.com のサイトに飛ぶ訳ですが。
むかーし、Tell Us にiCalに祝日提供してね、と送ったことがあったのだが、いつのまにかできていたのか、それとも、すでにあったのかいまとなってはすべて薮のなか。
♭ [Hoge] DION の DDNS だと 200円/月
IP電話の常時接続だから、かなり長時間にわたってルータに与えられているIP アドレスがかわらないようなきがするのだが。
2004-06-19 [長年日記]
♭ [Bike] リアのスポークが一本折れていた
ホイールを汚れをおとしていたら発見。
通りがかりのぬかや中目黒店 でスポークの交換修理が可能か問い合わせてみると、サイズか特殊だからすぐにはできない、とのこと。
買ったところに問い合わせなきゃいけないな。 ついでに、ブレもとってもらいたいところ。
♭ [Hexe] ヘッドフォンをしたまま電磁調理器で調理中の鍋にふれると赤外線をつかったワイヤレスヘッドフォンにノイズが聞こえる
熱になる以外になにか電磁波を放射しているのだろうか。 しかも、接触しないと影響ないというのが、なんとも。
ケータイの電波をヘッドフォンがひろってノイズになるのとちかい感じ。
ジャンプしてみた
空中でもノイズはした。 足が浮いた状態でも聞こえるということは、アースは関係ないわけですか。 ふつー、家電から電流もれるわけないか。
近づいてみた
非接触でヘッドフォンを接近してみる。 20センチくらいになると、ノイズがのってくる。 さらに数センチ近づくと、音が途絶える。
まさに、妨害電波。
2004-06-20 [長年日記]
♭ [P] 音ログ、古本、台風前夜
(12:10) アルゴリズムを実装するさいには、コメントを忘れずに。
(12:43) 無事にスピーチできたのだろうか? DVD で失敗した人を一人しっているだけに。
(15:20) 今日の古本買い取りは4,200-。
(22:18) 6,079w
(23:59) 具体的にすると、文字数がかさばる。 文字数を削ると、抽象になる。
♭ [R] How to Construct Bad Charts and Graphs
R-Help ML より。 グッドグラフとバッドグラフの例はないですか、という投稿にたいして紹介されていた。
バッドグラフの三つの基本的な要素は、
- Data Ambiguity (あいまいさ)
- Data Distortion (歪曲)
- Data Distraction (邪魔)
であるという。
Edward Tufte's fundamental rule of efficient graphical design is to minimize the ratio of ink-to-data.?
[http://lilt.ilstu.edu/gmklass/pos138/datadisplay/badchart.htmより引用]
というのは、通信という観点から正しいと思う。
関係ないが、R-Help メーリングリストはやさしさというか懐の深さを感じる、今日この頃。
2004-06-23 [長年日記]
♭ [P] 東京、GINZA、sudoers
(12:50) みおくり。
(16:43) sudoers に加えていただく。
(16:53) body { line-height: 180%; } してみた。 6,853w。
♭ [Bio][eTOCs] Protein Science 13(5)
- Predicting subcellular localization of proteins for Gram-negative bacteria by support vector machines based on n-peptide compositions
-
Chin-Sheng Yu, Chih-Jen Lin and Jenn-Kang Hwang
西方の方に教えていただく。グラム院生バクテリアのタンパク質細胞内予測法の提案。n文字のアミノ酸頻度をSVMで学習。PSORT-B と同じデータセットにおいて、Overallprediction accuracy が 89%。PSORT-B より 14% も良いと主張。
♭ [Hoge][Bio] 今日の whois
$ whois Bio1L.org NOT FOUND $ whois BioOneLiner.org NOT FOUND
アミノ酸と対応するコドンの表
$ ruby -rbio -e 'a=Bio::CodonTable[1]; b={}; a.sort {|c,d| c<=>d }.each {|k,v| begin b[v] << k; rescue;b[v]=[k];end }; b.sort {|e,f| e<=>f }.each{|x| puts x.flatten.join("\t") }'
* taa tag tga
A gca gcc gcg gct
C tgc tgt
D gac gat
E gaa gag
F ttc ttt
G gga ggc ggg ggt
H cac cat
I ata atc att
K aaa aag
L cta ctc ctg ctt tta ttg
M atg
N aac aat
P cca ccc ccg cct
Q caa cag
R aga agg cga cgc cgg cgt
S agc agt tca tcc tcg tct
T aca acc acg act
V gta gtc gtg gtt
W tgg
Y tac tat
2004-06-24 [長年日記]
♭ [Hoge][Bio][BioRuby] マルチファスタフォーマットの配列の長さの表をつくる
$ cat a.faa >a0 MAGLKRRASQVWPEEHGEQEHGLYSLLRNLMLQALP >a1 MAITDSLKQAVGHEAIKLLVNVDEEDYELGRQKLLRNLMLQALP >a2 hoge? MAGLKRRASQVWPEEHGEQEHGLYSLHRMFDIVGTHLTHRDVRV LSFLFVDVIDDHERGLIRNGRDFLLALERQGRCDESNFRQVLQ $ ruby -rbio -e 'Bio::FlatFile.auto($<).each do |faa| p [faa.entry_id, faa.seq.size] end;' < a.faa ["a0", 36] ["a1", 44] ["a2", 87]
2004-06-25 [長年日記]
♭ [Bio][BioRuby][Hoge] テキストに任意の幅で改行をいれる
$ ruby -e 'a="gcat"*10; puts a;puts; puts a.gsub(/(?w{0,10})/, "??1?n")'
gcatgcatgcatgcatgcatgcatgcatgcatgcatgcat
gcatgcatgc
atgcatgcat
gcatgcatgc
atgcatgcat
このやりかたは、教えてもらうまで気がつきもしませんでした。
$ perl -e '$a="acgtacgtacgtacgtacgtagct";$a =~ s/(.{0,10})/?1?n/g; print $a;'
acgtacgtac
gtacgtacgt
agct
Perl でもこのとおり。
♭ [Hoge][Ruby] ベン図作図
# Usage:
# ruby -rben-zu -e 'BenZu.fill("AB")' > AB.png;
#
# ruby -rben-zu -e 'a=BenZu.new(128,96,[0,0,255]); a.fill_AB; a.png' > AB.png;
#
class BenZu
def self.fill(type)
a = self.new
a.__send__("fill_#{type}")
a.png
end
def initialize(width = 256 - 64, height = 128, col = [255,0,0])
require 'GD'
@width = width
@height = height
@im = GD::Image.new(width, height)
col = [255,0,0] if col.size < 3
@color = {
'white' => @im.colorAllocate(255, 255, 255),
'black' => @im.colorAllocate(0, 0, 0),
'fill' => @im.colorAllocate(col[0].to_i, col[1].to_i, col[2].to_i)
}
@im.transparent(@color['white'])
@im.interlace = true
@im.rectangle(0, 0, @width - 1, @height - 1, @color['black'])
cx = @width / 3
cy = @height / 2
shift = @height / 10
long = cx + cx / 1.6
short = (@height - cy - shift) * 1.6
@im.arc(cx, cy - shift, long, short, 0, 360, @color['black'])
@im.arc(cx * 2, cy + shift, long, short, 0, 360, @color['black'])
end
def fill_AB
@im.fill(@width / 2, @height / 2, @color['fill'])
end
def fill_AnB
@im.fill(@width / 3, @height / 2, @color['fill'])
end
def fill_nAB
@im.fill(@width / 3 * 2, @height / 2, @color['fill'])
end
def fill_nAnB
@im.fill(2,2,@color['fill'])
end
def fill_A
self.fill_AnB
self.fill_AB
end
def fill_B
self.fill_nAB
self.fill_AB
end
def fill_nA
self.fill_nAB
self.fill_nAnB
end
def fill_nB
self.fill_AnB
self.fill_nAnB
end
def fill_all
self.fill_nAnB
self.fill_AnB
self.fill_nAB
self.fill_AB
end
def png(f = STDOUT)
@im.png f
end
end
if __FILE__ == $0
a = BenZu.new
a.fill_AB
a.png
end
♭ [Bio][eTOCs] NAR 32, Web Server issue
ウェブサーバ特集号。とりあえずすべて目をとおすこと。
- Riboswitch finder--a tool for identification of riboswitch RNAs
- Peter Bengert and Thomas Dandekar
- ASmodeler: gene modeling of alternative splicing from genomic alignment of mRNA, EST and protein sequences
- Namshin Kim, Seokmin Shin, and Sanghyuk Lee
- MITOPRED: a web server for the prediction of mitochondrial proteins
- Chittibabu Guda, Purnima Guda, Eoin Fahy, and Shankar Subramaniam
- PrediSi: prediction of signal peptides and their cleavage positions
- Karsten Hiller, Andreas Grote, Maurice Scheer, Richard Munch, and Dieter Jahn
- ESLpred: SVM-based method for subcellular localization of eukaryotic proteins using dipeptide composition and PSI-BLAST
- Manoj Bhasin and G. P. S. Raghava
- LOCnet and LOCtarget: sub-cellular localization for structural genomics targets
- Rajesh Nair and Burkhard Rost
- MOLPROBITY: structure validation and all-atom contact analysis for nucleic acids and their complexes
- Ian W. Davis, Laura Weston Murray, Jane S. Richardson, and David C. Richardson
♭ [R] 明日のセミナー
Rによる統計解析の基礎でセミナーをするシリーズの初回を頼まれてしまったので、その準備をする。 遺伝研でのセミナーのときのように R でできることを示すのが担当らしい。
2004-06-27 [長年日記]
♭ [Bio] 木更津からバスで30分というとこは、自転車で何分くらいですか?
八重洲口 14:30 の高速バスでいくのがフツーですが、木更津駅までバスでいって、その先は自転車でいってみようかとおもったり。
2004-06-28 [長年日記]
♭ [P] A有料オプション、
(02:50) 7/1 24:00に再放送があるのですね。
(09:00) 腎臓が、腎臓が、
(10:41) IRCStep のサイトが 404 Not Found になってる。
♭ [BioRuby] DAS から配列取得
$ ruby -rbio -rpp -e 'o="eco";
s=Bio::DAS.new("http://das.hgc.jp/cgi-bin/");
seg=Bio::DAS::SEGMENT.region(o, 1, 100);
pp s.get_dna(o, seg)'
[#<Bio::DAS::DNA:0x1534288
@entry_id="eco",
@length=100,
@sequence=
"agcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtctgatagcagcttctgaactggttacctgccgtgagtaaat",
@start="1",
@stop="100",
@version="1.0">]

Ω T井(アニオタ) [Rいいね。使ってみます。]