ヽ(´ー`)ノ
2004-03-01 [長年日記]
♭ [Bi] JSBi ニュースレター第8号
夏の学校が輪島であるとか、KNOBの紹介がなにげにあったりあったり。 まだ無いけどたぶんここ→<URL:http://jsbi.org/news/newsletter08.pdf>
♭ [Res] 共通点を探す コード化の終焉
直感に頼ってまわりまわってたどり着いたのが、プロファイルから共通点を探すことだった。 整数値プロファイルを 01 だけからなるインデックスプロファイルに変換。測定されたベクトルからすくなくとも一つ以上の共通要素をもつ要素の組み合わせを生成する。
01101: 01000,01100,01001,01101,00100,00101,00001
バイナリベクトルなので、再帰で木の探索とかしないで、二進数の足し算だけで組み合わせが列挙できるお手軽計算。 そして、プロファイル中でそれら要素のマッチを数えあげ、出現頻度順にならべる。 この頻度が、すなわち、共通プロファイルの頻度になってしまうのだった。 でもって、これから、モードを見つけたのだった。 これも一連の現象のある一面からの描像でしかないので、一連の現象にかかわる情報を統合してやらないといかん、というあたりさわりのない議論へと移行していくのであった。 でもって、それは次の仕事。
コード化の方針転換をする。 定性的な部分に定量的なものが混在している、ちょっと気持ち悪さを持ち合わせていたとあるコードシステムを捨てることにした。 自分が面白いデータの表現であるとおもっていて、何人かのひとは興味深いといってくれるが、そうは思わないひとを説得できないものだったりして、つまりは、よくない状況だったわけで、今日の対話でひとつの着地点を見いだせたのは、上出来であるとおもった。 対話は重要。
2004-03-02 [長年日記]
♭ [P] ks, orukt
徹夜すると反動がひどいのでできるだけ避けたほうがいい、このごろ。
eTOCs のレイアウトがめんどくしい。
知り合いから 03/01付けで助手になったよ、というメールが届く。 おめでとさん。
♭ [Bio][eTOCs] BIOINFORMATICS 20
- Rapid and sensitive dot-matrix methods for genome analysis
Yue Huang and Ling Zhang
Bioinformatics 2004 20: 460-466. - Mismatch string kernels for discriminative protein classification
Christina S. Leslie, Eleazar Eskin, Adiel Cohen, Jason Weston, and William Stafford Noble
Bioinformatics 2004 20: 467-476. - Predicting subcellular localization of proteins using machine-learned classifiers
Z. Lu, D. Szafron, R. Greiner, P. Lu, D.S. Wishart, B. Poulin, J. Anvik, C. Macdonell, and R. Eisner
Bioinformatics 2004 20: 547-556.
APPLICATION NOTE
- ChromoWheel: a new spin on eukaryotic chromosome visualization
Sven Ekdahl and Erik L. L. Sonnhammer
Bioinformatics 2004 20: 576-577. - FatiGO: a web tool for finding significant associations of Gene Ontology terms with groups of genes
Fatima Al-Shahrour, Ramon Diaz-Uriarte, and Joaquin Dopazo
Bioinformatics 2004 20: 578-580. - Support vector machine classification on the web
Paul Pavlidis, Ilan Wapinski, and William Stafford Noble
Bioinformatics 2004 20: 586-587. - FORTE: a profile-profile comparison tool for protein fold recognition
Kentaro Tomii and Yutaka Akiyama
Bioinformatics 2004 20: 594-595. - GENIUS II: a high-throughput database system for linking ORFs in complete genomes to known protein three-dimensional structures
Yukimitsu Yabuki, Yuri Mukai, Mark B. Swindells, and Makiko Suwa
Bioinformatics 2004 20: 596-598.
♭ [Bio][eTOCs] Genome Res 14
Comparative Analysis of Protein Domain Organization, Yuzhen Ye and Adam Godzik, Genome Res. 2004;14 343-353
'Whole Genome Sequence Comparisons and "Full-Length" cDNA Sequences: A Combined Approach to Evaluate and Improve Arabidopsis Genome Annotation', Vanina Castelli, Jean-Marc Aury, Olivier Jaillon, Patrick Wincker, Christian Clepet, Manuella Menard, Corinne Cruaud, Francis Quetier, Claude Scarpelli, Vincent Schachter, Gary Temple, Michel Caboche, Jean Weissenbach, and Marcel Salanoubat, Genome Res. 2004;14 406-413
The Multiassembly Problem: Reconstructing Multiple Transcript Isoforms From EST Fragment Mixtures, Yi Xing, Alissa Resch, and Christopher Lee, Genome Res. 2004;14 426-441 いままで開発してきた方法をパイプライン化。EST から予測 Alternatively-spliced Protein Isoform データセット ASP を作成。
MCALIGN: Stochastic Alignment of Noncoding DNA Sequences Based on an Evolutionary Model of Sequence Evolution, Peter D. Keightley and Toby Johnson, Genome Res. 2004;14 442-450
RESOURCES
Numerous Novel Annotations of the Human Genome Sequence Supported by a 5'-End-Enriched cDNA Collection Betina M. Porcel, Olivier Delfour, Vanina Castelli, Veronique De Berardinis, Lucie Friedlander, Corinne Cruaud, Abel Ureta-Vidal, Claude Scarpelli, Patrick Wincker, Vincent Schachter, William Saurin, Gabor Gyapay, Marcel Salanoubat, and Jean Weissenbach, Genome Res. 2004;14 463-471
zPicture: Dynamic Alignment and Visualization Tool for Analyzing Conservation Profiles Ivan Ovcharenko, Gabriela G. Loots, Ross C. Hardison, Webb Miller, and Lisa Stubbs, Genome Res. 2004;14 472-477
♭ [Bi] New journal The IEEE/ACM Transactions on Computational Biology and Bioinformatics
ACM/IEEE からバイオインフォマティクスの新雑誌創刊。ボードメンバーは CS 系のひとばかり、あたりまえですが。日本からは宮野先生が参加。
2004-03-03 [長年日記]
♭ [P] バックアップ 初期化 リストア
Retrospect で複製。
いままでの不調は問題あるセクタがあるのが原因と断定して、ゼロ初期化。
CCC でリストア。
起動できなかった。 Single user mode でみるとkext関係のplistがいくつかなくなっているようだった。 /etc/rc の最期の行でお亡くなりになっていた。 ということで、OS再インストール。
ようやく復活。24時間以上かかってしまいました。 はー。
♭ [Bi] Lincoln D. Stein to be presented the 2004 Benjamin Franklin Award in Bioinformatics
2002 年は マイク・アイゼン、2003 年のジム・ケントにつづいての受賞。
(from <URL:http://nodalpoint.org/>)
2004-03-05 [長年日記]
♭ [Mac] Samba の設定
Windows のファイル共有ができるネットワークスキャナ(+プリンタ、+コピーの複合機)があるので、それから直接手前のマシンへ保存してみた。 このスキャナは画像を直接PDFで保存できたりかなり高性能。
いつものユーザでは、マニュアル通りにやっても使えなかった。 ためしに新規ユーザでやってみると、あっさりログインできた。 長くつかっていると、腐れていくのはいたしかたない。 ファストユーザスイッチのおかげで、ユーザ間を簡単に行き来できるので、WIndows共有専用のユーザをつかうのでもいいかと思ったり。
2004-03-06 [長年日記]
♭ [P] 工事
夜半から雨がふっていたり。昼過ぎから隣の部屋の工事がはじまったり。
わけのわからん夢をみた。 たぶん、あの一連のメールのせいに違いない(たぶん〜にちがいない構文)。 わけのわかる夢を見たほうがおかしいということに気がついたので、つまりは、単に夢にでたということ。
CD屋にいったら、うっかり坂本龍一の新譜を手にとってレジに向かおうとしていた。 あぶないあぶない。
上総かえりに便乗客人3人。 某未踏成果物を見せていただいたり、狙い撃ちだった話を聞いたり。
判断を保留していると、消えちゃうのか。
♭ [Ruby] 多段に sort は Array#<=>
つかうたびに忘れるている。 Array#<=> をつかうのだった。
ary = [ [1,2,3], [2,2,2], [1,1,1] ]
ary.sort #=> [ [1,1,1], [1,2,3], [2,2,2] ]
ary.sort {|a, b|
[a[2], a[1]] <=> [b[2], b[1]] # 後ろから内側になる
} #=> [ [1,1,1], [2,2,2]. [1,2,3] ]
ちなみに、sort(1) の +POS1[-POS2] の形式もたいてい覚えていない。 む、この形式は obsolete なのか。 POSIX 形式は、-k POS1[,POS2] だったのか。 がーん。
2004-03-07 [長年日記]
♭ [P] バックパック購入
定規がない。 それが問題だ。
ランバーバック買おうと思っていたら、10 リットルのバックパックででもノートPC+書類くらい運ぶには十分であるのがわかったのでバックパックに変更。
♭ [R] Statistiques avec R
RjpWiki の掲示板経由、r-help でも話題沸騰のRのチュートリアル(フランス語)。 夏までには英語版ができるかも、とのこと。 Graphiques avec R は圧巻です。すごすぎ。 作者の Zoonekynd 氏はバイオインフォマティクス関係の研究をしているようで、そのすじにはピンとくるような例があったりなかったり。
2004-03-08 [長年日記]
♭ [P] G4きた
ヘッダに puts と書いて SecurityError
昨日買った ODYSSEY はいいかんじ。
持ち運び用に Powerbook を買ったヒトが 17inch のを持ってきた。 曰く、注文をひとにたのんだら「いちばんワイドなものを」という発注になったらしい。 一応ショックらしいので、これが一番薄いPowerbookですよ、となだめてみたり。 知らなかったのですが、これにも iLife 4 がバンドルされているのですね。 あと、X11 がインストールされていなかったです。 そういう仕様なのでしょうか。 リストアDVDから X11User.pkg をなんとか発掘してインストールしました。 相当面倒でした。
♭ [Mac] Power Mac G4(PCI グラフィックス)
いわゆる Yikes。 縁あって譲り受ける。 メモリ 64MB。 HDD 40 GB。 ビデオカードは ATI Rage128 16MB (PCI) 。
メモリは PC100 で 256MB が 11,800- くらいか。
♭ [R][Bio] スポットファイアー WorkShop 2004
'統計ソフト"R" 使用事例、SNP Anlaysis、Protein Expression Analysis、 Metabonomicsなど(無料!)'
これは面白そうです。 Metabonomics ってのが特に B)。 03/11 は木曜日なので、セミナーがあり行けません。
Google でしらべると、Metabolomics と Metabonomics の違いっぽい記載がみつかる。 ここによると Jeremy K. Nicholson が Metabonomics を提唱したらしい。
♭ [Bio] CDS と ORF
Kasu 氏 が見つけたので定義を調べてみた。 Sequence Ontology (SO) における定義から。
CDS の定義
term: CDS id: SO:0000316 definition: A contiguous RNA sequence which begins with, and includes, a start codon and ends with, and includes, a stop codon. definition_reference: SO:MA
ORF の定義
term: ORF id: SO:0000236 definition: A nucleic acid sequence that, when read as sequential triplets, has the potential of encoding a sequential string of amino acids. definition_reference: SO:MA
おおきな違いは分子の違いであるといえる。 SO の定義では CDS は RNA 分子(mRNA)に対して付けられて、ORF はゲノムでもよい。
2004-03-09 [長年日記]
♭ [P] frkm、写真、kys超便
そろそろ、メールアカウントの整理などの身辺整理をしなければ。
金曜日の店の予約が完了したらしいです。
何か用の写真を撮ったり。 室内でフラッシュ無しでとったら、ISO 200で1/60でf2.8で、解像度感レスな感じ。 肌色が塗り物のよう。
♭ [Mac] iPod 壊れつつあり
ライブラリのシンクが途中でとまるようになった。 曲順にかかわらず二曲目でとまる。 こまったものだ。 OS ごと止めてしまうので、むりやり FireWire を引き抜くしかなくなってしまう。 こまったものだ。
♭ {R] Mathmatica のノートブックのようなものが欲しかったり
メモと数式(スクリプト)とグラフがおなじページにおさまるような感じ。
2004-03-10 [長年日記]
♭ [Bio] Ontology は計算機的虚構ではない
Gene Ontology (GO) では controled vocabulary と terms 間の関係 (DAG) が策定され、さらに、Gene association いわゆる実体へのアノテーションをどのようなサポートに因るかを evidence codes の付与によって実施する、その実現のためのさまざまなものを提供している。 少なくとも、GO については実験的根拠はアノテーションに対して問われることであって、オントロジーの定義自体へ問うことではない。
とかなんとか。
最近の go-friends ML での Draft evidence code ontology スレッドは興味深い。
♭ [Mac] iBookG4でデュアルモニタ 人柱シリーズ
ま じ で す か。(K. Moriyama's diary 経由)
ATI Radeon Mobility 搭載 iBook ならhttp://macparts.de/ibook/ にある Screen Spanning Doctor (v0.3.2) でOpen Firmware を書き換えて実現。
これでは、12inch の iBook G4 への Powerbook G4 の優位点が、特に機能的な優位がかなりなくなってしまいますね。
- 差が無くなってしまった点
- 最大メモリーは +1024MB、Dual display。
- のこされた優位点
- 重さ200g、底面積、SuperDrive、DVI 出力。
連続駆動時間については iBook G4 の方が 6h で Powerbook G4 が 5h と負けていたりする。
♭ [Bio][eTOCs] NAR 32
- Evidence for a subpopulation of conserved alternative splicing events under selection pressure for protein reading frame preservation Alissa Resch, Yi Xing, Alexander Alekseyenko, Barmak Modrek, and Christopher Lee Nucl. Acids. Res. 2004 32: 1261-1269.
- この ASAP のグループはデータベースの開発が落ち着いてきたので AS の遺伝子進化への寄与についての研究をすすめているようであるが、この論文では選択的カセットエキソンが 3 の倍数の塩基長かどうかとういう点で調べた。3 の倍数でないと、カセットエキソンが無いフォームはフレームシフトがおこってしまう。
- LEON: multiple aLignment Evaluation Of Neighbours Julie D. Thompson, Veronique Prigent, and Olivier Poch, Nucl. Acids. Res. 2004 32: 1298-1307.
- アラインメント。
- ARB: a software environment for sequence data, Wolfgang Ludwig, Oliver Strunk, Ralf Westram, Lothar Richter, Harald Meier, Yadhukumar, Arno Buchner, Tina Lai, Susanne Steppi, Gangolf Jo?bb, Wolfram Forster, Igor Brettske, Stefan Gerber, Anton W. Ginhart, Oliver Gross, Silke Grumann, Stefan Hermann, Ralf Jost, Andreas Konig, Thomas Liss, Ralph Lussmann, Michael May, Bjorn Nonhoff, Boris Reichel, Robert Strehlow, Alexandros Stamatakis, Norbert Stuckmann, Alexander Vilbig, Michael Lenke, Thomas Ludwig, Arndt Bode, and Karl-Heinz Schleifer, Nucl. Acids. Res. 2004 32: 1363-1371.
- 配列解析環境
- Detection of functional DNA motifs via statistical over-representation, Martin C. Frith, Yutao Fu, Liqun Yu, Jiang-Fan Chen, Ulla Hansen, and Zhiping Weng, Nucl. Acids. Res. 2004 32: 1372-1381.
- DNAモチーフを統計的に検出。
- 5'-Untranslated regions with multiple upstream AUG codons can support low-level translation via leaky scanning and reinitiation, Xue-Qing Wang and Joseph A. Rothnagel, Nucl. Acids. Res. 2004 32: 1382-1391.
- 翻訳制御と5'UTR。
- Identifying secretomes in people, pufferfish and pigs, Eric W. Klee, Daniel F. Carlson, Scott C. Fahrenkrug, Stephen C. Ekker, and Lynda B. M. Ellis, Nucl. Acids. Res. 2004 32: 1414-1421.
- セクレトーム。 それにしてもなぜに people ? BLAST と TagetP で分泌タンパク質をヒト(RefSeq、 NCBI GenScan、IPI)とフグについて推定。 TIGR Gene Index と比較。
- Efficient RNA interference depends on global context of the target sequence: quantitative analysis of silencing efficiency using Eulerian graph representation of siRNA, Petr Pancoska, Zdenek Moravek, and Ute M. Moll, Nucl. Acids. Res. 2004 32: 1469-1479.
♭ [Bio][eTOCs] Genome Biol.
- Archaeal phylogeny based on proteins of the transcription and translation machineries: tackling the Methanopyrus kandleri paradox,Celine Brochier, Patrick Forterre, Simonetta Gribaldo
- 転写と翻訳装置のタンパク質でアーキアの系藤樹を推定してみる。
- FlyGEM, a full transcriptome array platform for the Drosophila community,Rick Johnston, Bruce Wang, Rachel Nuttall, Michael Doctolero, Pamela Edwards, Jining L?, Marina Vainer, Huibin Yue, Xinhao Wang, James Minor, Cathy Chan, Alex Lash, Thomas Goralski, Michael Parisi, Brian Oliver, Scott Eastman
- ハエのトランスクリプトーム。
- Prediction of Saccharomyces cerevisiae replication origins, Breier AM, Chatterji S, Cozzarelli NR / 04 March 2004
- 初めての複製オリジン予測法 Oriscan を開発。 いままで配列だけでは予測できないと考えられてきた。 PSSM の統合でよそく。 予測上位100位までで 94%、上位350位までで70%のSpecificityを達成。
- Expression profiling of mammalian microRNAs uncovers a subset of brain-expressed microRNAs with possible roles in murine and human neuronal differentiation, Sempere LF, Freemantle S, Pitha-Rowe I, Moss E, Dmitrovsky E, Ambros V / 16 February 2004
- 分化にマイクロRNAかも。
2004-03-12 [長年日記]
♭ [Mac] sips で画像変換
% sips -h |head -3 sips 1.0 - scriptable image processing system. This tool is used to query or modify raster image files and ColorSync ICC profiles. Its functionality can also be used through the "Image Events" AppleScript suite.
画像のリサイズ
% sips --resampleWidth 128 hoge.jpg # 幅 128 ピクセルに変換
♭ [Bio] GK version 8 リリース
GO を辞書としてつかったイベント指向データベース Genome Knowledgebase のバージョン8のリリース。 (from go-friends ML)
Core Expanded Accessioned Entities 762 1961 Concrete Complexes 446 1345 Generic Complexes 232 569 Concrete Reactions 749 2735 Concrete Pathways 61 277 Generic Reactions 451 1520 Generic Pathways 251 839 Literature References 794 794
Core はその筋の専門家かつけたアノテーション。 データ量を22番染色体サイズまで拡大。 LocusLink、Ensembl へのリンクを設置など。
たとえば、Base Excision Repair は DNA Repair の子ノードであるが、その詳細は、 <View in eventbrowser>と<View in instancebrowser>を行き来すると、だいたい把握できる。 敢えていえば、これは分子細胞生物学のすごい教科書であり、リッチなGOのブラウザでもある。
2004-03-15 [長年日記]
♭ [Bio][eTOCs] PNAS of February 24, 2004
Differential recruitment of nuclear receptor coactivators may determine alternative RNA splice site choice in target genes, Didier Auboeuf, Dennis H. Dowhan, Yun Kyoung Kang, Kimberly Larkin, Jae Woon Lee, Susan M. Berget, and Bert W. O'Malley ステロイドホルモン依存のプロモーターでもってスプライスバリアント。
2004-03-17 [長年日記]
♭ [Hoge] ADSL の某測定してみた
------ BNRスピードテスト (ダウンロード速度) ------ 測定サイト http://www.musen-lan.com/speed/ Ver3.3001 測定日時 2004/03/17 11:46:39 回線/ISP/地域 未登録 / 未登録 / 未登録 -------------------------------------------------- 1.NTTPC(WebARENA) / 761.441kbps(0.761Mbps) 94.52kB/sec 2.ASAHI-Net / 753.353kbps(0.753Mbps) 93.34kB/sec 推定転送速度 / 761.441kbps(0.761Mbps) 94.52kB/sec
2004-03-18 [長年日記]
♭ [Hoge] お絵描きセミナー
キーワードは、GD.pm の使い方/Stain/perldoc GD/ドロー系/プリミティブ/Postscriot/LibPlot/SVG/Bio::Graphic/BioPerl?のBioGraphics?モジュールにあるxyplotを使う(1)/gbrowser/Todd W. Harris, Mac OS X Packages for Bioinformatics/DAS/Nature/everything/なんでBioPerlの説明を/
2004-03-21 [長年日記]
♭ [Mac] Safari で利用できる img src='hoge.pdf'
イントラの論文管理 Wiki で使っています。 標準でないので Mac OS X の localhost でしか使えない罠。 っていうか邪道。
♭ [Mac] pTeX package for Mac OS X
04 年度版が 03/20 に公開。
2004-03-22 [長年日記]
♭ [Mac] (ハング)は疑わしい
Activity Moniter.app で(ハング)と表示されるプロセスの多くは暴走しているのではなく、ただ重たい計算をしていることがしばしば。たとえば、巨大なHTML書類をブラウザで開くとか、Cluster.app でクラスタリングすると、(ハング)するが、しばしまてば正常な結果を返してくれる。いままで(ハング)即強制終了していたが、一概にはそうするべきではないのがわかった今日この頃。
♭ [Res] クラスター解析
発現データじゃないけど Cluster.app で cdt ファイルをつくって、Java TreeView.app で眺める。 iBook だと画面が狭くて泣ける。 値を二値にしたり、いろいろいじったり。 GIF で画像を保存しようとすると、メモリー足りないエラーで断念。
その後、企業からきている研究員のかたに SpotFire みせてもらってビビったり。
クラスター解析は意外と好感触。 これがクラスター解析の効果か(ちがう。
2004-03-23 [長年日記]
♭ [Bio] Journal of proteome research
CBRC に冊子体があるのを発見。 はじめて見た。 ACS のジャーナルなんだ。 Web の TOC が JACS のとおんなじでキャッチーなフィギュア付きタイトル。
Assessing the Impact of Alternative Splicing on Domain Interactions in the Human Proteome Alissa Resch, Yi Xing, Barmak Modrek, Michael Gorlick, Robert Riley, and Christopher Lee, Journal of Proteome Research, 3 (1), 76 -83, 2004. 10.1021/pr034064v S1535-3893(03)04064-8 Web Release Date: November 19, 2003 <URL:www.bioinformatics.ucla.edu/ASP> をつかった、選択的スプライシングによってgain/lossする機能ドメインの解析。タンパク質相互作用に関係するドメインがおおく、そのうち数例についてタンパク質ネットワークへの影響を考察。タンパク質相互作用ネットワークの<スイッチ>の制御に選択的スプライシングも重要な要素であると主張。
♭ [Mac] Powerbook G4 12inch.
を入手したので、設定はじめる。ぼちぼち。
X11.app ははいっていない。そういうものなのか。 /Volumes/Powerbook Software/System/Installation/Packages/X11User.pkg をインストール。
ファイアウォールの設定。 「システム環境設定」→「共有」→「ファイアウォール」で、「新規...」で CVS、IRC、VNC をプリセットのメニューから選択。ポート番号の範囲 6000-6001 で X11、3306 で MySQL を設定。
/Applications/installer/Xcode Tools/Developer.mpkg をインストール。
ptex2004v1.dmg をダウンロードのちにインストール。「雨ニモマケズ」がちゃんと読めました。
EasyPackage でいろいろいれる。いろいろ。
♭ [R] useR! 2004 のプログラム
<URL:http://www.ci.tuwien.ac.at/Conferences/useR-2004/program.html> (from r-help ML)
2004-03-25 [長年日記]
♭ [R] 二変量データのヒストグラム:marginal
RjpWiki の中のコンテンツ。これかっこいい。二変量の散布図にヒストグラムをそれぞれつけた図。要 CRAN::ade4。
♭ [Mac] MySQL のインストール
EasyPackage の lang/mysql をインストール。info info/mysql.info を参考に後インストール処理をすすめる。
$ cd /usr/local/mysql $ sudo bin/mysql_install_db ... $ /usr/local/mysql/bin/mysqladmin -u root password 'new-password'
♭ [Ruby] Array#<< と Array#push
というか、演算子の優先順か。
ary = [] ary << 1 == 1 ary #=> [1] ary.push(1 == 1) ary #=> [1, true] ary << (1 == 1) ary #=> [1, true, true] ary.push 1 == 1 ary #=> [1, true, true, true]
♭ [Bio] BioPerl とかいろいろインストール
Todd Harris@CSHL の Mac OS X Packages For Bioinformatics から Libraries-10.3.pkg.tgz をダウンロードのちインストール。このインストールには /usr/local/mysql が必要。
つぎは DAS サーバになるらしい GBrowse の CVS HEAD をインストールしたいところ。 Installing the Generic Genome Browser on Mac OS X を参考にしてインストール。
$ cd Generic-Genome-Browser $ perl Makefile.PL (ry $ make $ sudo make install
<URL:http://127.0.0.1/cgi-bin/gbrowse?source=yeast> でいきなり動くから驚く。
あれ? use IO で落ちてるギミ。 データをインストールしないといけないのか。 INSTALL の 5. POPULATING THE DATABASE (MySQL) をみて MySQL にデータをロードするする。
2004-03-26 [長年日記]
♭ [BioRuby] Fasta フォーマットを読み込んでなんかしたいとき
$ cat hoge.faa
>hoge
ARUDE
>fuga
MAJI
$ cat aa123.rb
require 'bio'
Bio::FlatFile.auto($<).each do |faa| # 配列ファイルを自動判定して1エントリづつ
# アミノ酸配列を一文字づつ変換
faa.data = faa.seq.split(//).map {|aa|
Bio::AminoAcid::Names[aa]
}.join
puts faa.to_s # Bio::FastaFormat#to_s で文字列に戻す
end
$ ruby aa123.rb < fuga.faa
>hoge
AlaArgSecAspGlu
>fuga
MetAlaIle
ファイルの入力は Bio::FlatFile クラスにお任せできるのがいいですね。 こーいうのはそのうち <URL:http://wiki.bioruby.org/Japanese/> うつすのがいいかと。
♭ [Hoge] 事務オリエンテーション通知
きた。メールアドレスの登録。SecurID の発行。名札用写真撮影。誓約書を書くのか。給与と旅費の振込口座の記載と印鑑持参のこと。 制度上メールアドレスが途切れるてしまうのはしかたがない。
♭ [Res] パターン分類と階層構造
パターン分類していると、パターンやパターンの構成要素間に階層関係をつけたくなるけど、それは自然と親を複数もちえる DAG になってしまうということを、昨晩コンビニに行く途中に気がついた。
とすると、パターン分類には、小さなオントロジーを定義して、それを使ってアノテーションする作業が含まれるといえる。そして、その小さなオントロジーをつかった解析は、(GO) Slim だったり、Fisher's exact test をつかったりすることになるわけだ。
GO に限定しない DAG の定義、アノテーション、解析を軽々こなすためのツールキットがあるといいな。
とかいっていると、go-friends ML に Gene Ontology Annotation Tool (GOAT) のアナウンスがながれた。 でも、Windows のアプリっぽい。
♭ [SC} 5=========6======+
目黒川のサクラが七分咲き。
2004-03-27 [長年日記]
♭ [Mac] 後始末(ファイル編)
現在使用中主力 iBook(60GB) と控え PBG4 15 (外付け180GB)のファイルを 次期主力 PBG4 12(80GB) に移さなければならない。 iBook の /Users は 15GB 使用中、PBG4 15 の /Users は 38GB 使用中。なににそんなに消費しているのでしょうか。 UCSC のゲノムブラウザのデータとか sptr とかローカルにあるからですね。~/Library/Bioinformatics/db とかに 21GB ほどありました。なにかが。
今日のことば:無線LAN経由でGBクラスのファイル転送しないほうがいいぞ。350KB しかスループットが出ないからだ。
2004-03-28 [長年日記]
♭ [Bio] Omics BioSPICE Special Issue
最近しばしば見かける BioSPICE は DARPA のプロジェクトです。
♭ [Bio][Bi] ソフトコンピューティングとしてのバイオインフォマティクス、Gary B Forgel 編、伊庭 斉志 監訳、東京電機大学出版局
書店で伊庭 斉志さんのあたらしい本を発見。 が、アマゾンには見つからなかった。 ジュンク堂で発見発見。 TDU出版局のサイトには3月の新刊情報がない。
解説によると、Evolutionary Computation in Bioinformatics を院生とともに翻訳した本。 内容は、カオスゲームでゲノム可視化などなど、どこかできいたことがあるような気が。 訳本なのに原著より安いのが驚き。
2004-03-29 [長年日記]
♭ [Hoge] glocal <- global + local
リーダースにあった。 事業を地球規模(global)に展開して、同時に現地(local)の実情に適応させる、ことをさす。
ま、glocal alignement でよろしく。
っていうか、発見。 Brudno et al. (2003) Glocal alignment: finding rearrangements during alignment, BIOINFORMATICS LAGAN のとこですね。<URL:http://lagan.stanford.edu/glocal>
♭ [Ruby] RandomNote
おもしろそう。
「ページ名をつける必要のない Wiki とはどんなんだろう」と考え、
検索を利用したらシンプルで使いよいのができるんでねえのかと思っ た。
そして作ってみた。
2004-03-30 [長年日記]
♭ [Mac] 後始末(ファイル編 その2)
iBook さんと PBG4 15 のホームをすべてPBG4 12 の ~/Documents/OldHome とかに一時的においとく。手動でちまちまと重複を取り除いて false-negative のないようにする。
Mew 環境を移行する。 これを機に Carbon Emacs でやってみる。 フォントはきれいなほうがいいわけで。 105 と Emacs21 on Mac入門から中毒まで をみつつインストール。 とみせかけて、cp -rp ${MyOldUsers)/.emacs.d ~/ とかですます。 が、Mew だけ /sw/lib/emacs 以下にインストールしていたので、通常のインストールに戻る。
mewls がなぜか、mew からみつからない。 Google で発見、(exec-path) を環境変数から引き継がないのか。設定ファイルに、
(setq exec-path (append '("/usr/local/bin") exec-path))
を足しておく。
2004-03-31 [長年日記]
♭ [OS] ディレクティブ クイックリファレンス - Apache HTTP サーバ
ちょっと調べたときにたどり着く。 すばらしい。
経路は、http://localhost → http://localhost/manual/index.html → "PATH ENV" で検索のトップ。
♭ [P] 後始末(ラボ→ラボ編)
y氏の車が借りれる予定であったが、急遽、#号になる。 17:20 スタートで荷物を搬出。 往路は芝浦の交差点で左右まちがえ、品川方面へいってしまう。 ベンチャーセーフネットのあたりから復帰。 防災センターで車寄せ利用を申請して、事務方に電話して台車を借りる。 うわさの貨物専用エレベーターであがると、そこはブースまじかのドアだった。 18:20 に帰路出発。 18:40 にセンター到着。
のこりの荷物を搬入して二回目の出発。 すこし渋滞がゆるんできたのと、経路を間違わなかったので、さきほどより早くついた。 17:20 に到着。 搬入をおえて、フロアを一回りして、20時過ぎに撤収。
Ω hub [君の論文?]
Ω thecla [http://embryogenomics.net/archives/2004_03_05.html#000040 ..]