ヽ(´ー`)ノ
2004-02-01 [長年日記]
♭ [P] Frog、MEG, ADSL
眠れない。 そのままごそごそして、6 時に部屋をでる。9 時に新宿。10 時まで LINKED 日本語版を読む。凝縮系にいっちゃったよ、びっくり。10 時からハンズ、JOKER の順に巡る。逡巡してしまったが、ネタに走る。それがわたしの生きる道。昼過ぎに so 氏さらわれる。気がついたら代々木をすぎていたのは内緒だ。中野界隈で聖地巡礼。「もう<半角>ダメポ</半角>証明書」400 円也。気がついたら黒字に赤い文字のふくろを持っていた。恐るべし。19 時に納車。白金まで走行テスト。シートが痛い以外はなかなか。
マシンが落ちているもよう。 iSync が刺さっていた。
ADSL の申し込みをしてみた。最大 1 ヶ月くらいかかるといわれる。
2004-02-02 [長年日記]
♭ [P] 雨、
なんとなく、体内時計が、東にシフト
秘書の ni さんの誕生日だった。
私的流用がなければなにしてもいい、とかいうような考えが先立つのはなぜ。 具体的になにかあったわけではありません。
♭ [Bio][eTOCs] BioMedNet Reviews
- Global analysis of bacterial transcription factors to predict cellular target processes
Tobias Doerks, Miguel A. Andrade, Warren Lathe 3rd, Christian von Mering and Peer Bork
Trends in Genetics, (January 29, 2004), 10.1016/S0168-9525(04)00021-6
http://reviews.bmn.com/browse/areas/record?tocname=Genetics&pii=S0168952504000216
バクテリアの転写因子のかかわるプロセスの予測。Borkのとこらしいゲノム系研究。COG と STRING を使用。転写因子のオーソロググループ 128 個のうち 36 グループが機能未知。それらがどの細胞内プロセス、パスウェイにかかわるかを予測。うち半分について推定できた。 - Human genetics, animal models and computer simulations for studying hypertension
Nobuyuki Takahashi and Oliver Smithies
Trends in Genetics, (January 28, 2004), 10.1016/S0168-9525(04)00018-6
http://reviews.bmn.com/browse/areas/record?tocname=Genetics&pii=S0168952504000186
高血圧モデル研究 - Bacterial programmed cell death systems as targets for antibiotics
Hanna Engelberg-Kulka, Boaz Sat, Myriam Reches, Shahar Amitai and Ronen Hazan
Trends in Microbiology, 2004, 12:266-71
http://reviews.bmn.com/browse/areas/record?tocname=Microbiology&pii=S0966842X0300335
バクテリアのアポトーシス - The power in comparisons
William C. Nierman and Claire M. Fraser
Trends in Microbiology, 2004, 12:262-63
http://reviews.bmn.com/browse/areas/record?tocname=Microbiology&pii=S0966842X03003305
♭ [Ruby][RRb] RRB(仮) - Ruby Refactoring Browser -
KMC の大林さんによる emacs でつかうツール。 Ruby とおなじライセンスで公開。アルファリリース。
♭ [Bio][Bi] DDBJ メールマガジン No.12 (2004.02.02)
寺小屋「情報生物学」、日韓バイオインフォマティクストレーニングコース、WASH3、ノンリダンダントアミノ酸配列データベース Grand-DAD など。
Grand-DAD はきになるところ。 DAD, SWISS-PROT, PIR, PDB, PRF から作成しているらしい。 UniProt となにかちがうのかな?
DAD (DDBJ Amino acid Database) っていうアミノ酸配列のデータベースがあるのか。
DAD (DDBJ Amino acid sequence Database) は, DDBJ の塩基配列データベースからタンパク質をコードした部分を抽出して作成したアミノ酸配列データベースです。
[http://www.ddbj.nig.ac.jp/ddbjnew/off16/camusdb-j.htmlより引用]
うーむ。 NCBI Proteins の一部、UniProt TrEMBL と同等物なのか。
DDBJ のサイトにはリファレンス的な文章が無いのがいけないね。 DAD について調べてもさっぱりたどれなかった。 EBI のサイトを見習ってほしい。
2004-02-03 [長年日記]
♭ [P] プログレス
すごい発見ではないが、もしかしたらすごいことの発見なのかもしれない。
眠れない。「最近、飲んでも眠れないんです」というたら、「飲みがたりないんです」といわれた。
説得力が問題だ。 「〜が〜に特徴的なプロパティであることに気がついていないわけではない」というシメのネタをいってみたら、あきれられた。遊びがすぎたか。
あれらのエントリが同居しているのは、なんだか可笑しい。
♭ [Bio] あたらしいタンパク質相互作用データのフォーマット
Henning Hermjakob, Luisa Montecchi-Palazzi, Gary Bader, Je'ro^me Wojcik, Lukasz Salwinski, Arnaud Ceo, Susan Moore, Sandra Orchard, Ugis Sarkans, Christian von Mering, Bernd Roechert, Sylvain Poux, Eva Jung, Henning Mersch, Paul Kersey, Michael Lappe, Yixue Li, Rong Zeng, Debashis Rana, Macha Nikolski, Holger Husi, Christine Brun, K Shanker, Seth G N Grant, Chris Sander, Peer Bork, Weimin Zhu, Akhilesh Pandey, Alvis Brazma, Bernard Jacq, Marc Vidal, David Sherman, Pierre Legrain, Gianni Cesareni, Ioannis Xenarios, David Eisenberg, Boris Steipe, Chris Hogue & Rolf Apweiler (2004) The HUPO PSI's Molecular Interaction format?a community standard for the representation of protein interaction data, Nature Biotech, 22(2), 177-183
日本からの貢献はゼロ。
♭ [Hoge] LINKED 日本語版を読んだ
新ネットワーク思考〜世界のしくみを読み解く〜、アルバート=ラズロ・バラバシ[著]、青木薫[訳]
いたるところにスケールフリー・ネットワークが見つかるわけであるが、それがどうしたの?という疑問は常にあたまのかたすみにあったのは昨日までのこと。
スケールフリー・モデルから得られる予測のなかで一番重要なのは、「多くのリンクをもつノードは古い」ということだろう。これを代謝という観点から言い換えれば、多くのリンクをもつ分子は、その細胞の中でも古株の分子だということになる。
[p267 第十三章 生命の地図より引用]
これからは、ベキ分布があらわれたら、ランダムではなくスケールフリー・ネットワーク的に解釈すればいいのだ。
このときはじめて複雑な世界にメスが入ったといって、「それまでの科学は視野が狭かった」とか、「科学者はそれまで複雑な系の存在に気づいていなかった」といった見方は的はずれだろう。科学者は複雑な系の存在にはもちろん気づいていたけれども、道具がないために手がだせなかっただけなのだ。線形から非線形へ、単純から複雑へという流れ自体は、「できることからやっていく」という科学の流儀からいえば当然のことであり、コンピュータさえあれば、ニュートンだってきっと複雑系を研究したに違いないのである。
[p325 訳者あとがきより引用]
巻末メモは訳本でそこなわれがちな "OUT リンク"を補完していてとてもよい。
♭ [Bio][eTOCs] Genome Biol. 5(2)
- MINIREVIEWS Rewiring the transcriptional regulatory circuits of cells
Devin R Scannell, Ken Wolfe
http://genomebiology.com/mkt/5014/2004/5/2/206 - PROTEIN FAMILY REVIEW Adenosine deaminases acting on RNA (ADARs): RNA-editing enzymes
Liam P Keegan, Anne Leroy, Duncan Sproul, Mary A O'Connell
http://genomebiology.com/mkt/5014/2004/5/2/209 - An unappreciated role for RNA surveillance
R Tyler Hillman, Richard E Green, Steven E Brenner
http://genomebiology.com/mkt/5014/2004/5/2/R8
NMD っぽい配列を SWISS-PROT の alternative splice のエントリ(ヒト)のなかで探すと、107 アイソフォーム見つかった。 - In silico identification and experimental validation of PmrAB targets in Salmonella typhimurium by regulatory motif detection
Kathleen Marchal, Sigrid De Keersmaecker, Pieter Monsieurs, Nadja van Boxel, Karen Lemmens, Gert Thijs, Jos Vanderleyden, Bart De Moor
http://genomebiology.com/mkt/5014/2004/5/2/R9 - Software Versatile and open software for comparing large genomes
Stefan Kurtz, Adam Phillippy, Arthur L Delcher, Michael Smoot, Martin Shumway, Corina Antonescu, Steven L Salzberg
http://genomebiology.com/mkt/5014/2004/5/2/R12
TIGR のゲノム比較ツール MUMmer のアップデート。このバージョンからオープンソースになりました。
♭ [Bio][eTOCs] NAR 32(2)
- Identification and characterization of two forms of mouse MUTYH proteins encoded by alternatively spliced transcripts
Akimasa Ichinoe, Mehrdad Behmanesh, Yohei Tominaga, Yasuhiro Ushijima, Seiki Hirano, Yasunari Sakai, Daisuke Tsuchimoto, Kunihiko Sakumi, Norio Wake, and Yusaku Nakabeppu
(Published online 23 January 2004) Nucl. Acids. Res. 2004 32: 477-487.
AS アイソフォームの同定。 - Statistical resynchronization and Bayesian detection of periodically expressed genes
Xin Lu, Wen Zhang, Zhaohui S. Qin, Kurt E. Kwast, and Jun S. Liu
(Published online 22 January 2004) Nucl. Acids. Res. 2004 32: 447-455.
ベイズ - Premature termination codons enhance mRNA decapping in human cells
P. Couttet and T. Grange
(Published online 23 January 2004) Nucl. Acids. Res. 2004 32: 488-494. - Surprising features of plastid ndhD transcripts: addition of non-encoded nucleotides and polysome association of mRNAs with an unedited start codon
Aitor Zandueta-Criado and Ralph Bock
(Published online 26 January 2004) Nucl. Acids. Res. 2004 32: 542-550. - A new gamma-interferon-inducible promoter and splice variants of an anti-angiogenic human tRNA synthetase
Jianming Liu, Eveline Shue, Karla L. Ewalt, and Paul Schimmel
(Published online 2 February 2004) Nucl. Acids. Res. 2004 32: 719-727.
♭ [Bio][eTOCs] Genome Res 14(2)
- A Motif Co-Occurrence Approach for Genome-Wide Prediction of Transcription-Factor-Binding Sites in Escherichia coli
Martha L. Bulyk, Abigail M. McGuire, Nobuhisa Masuda, and George M. Church
Genome Res. 2004;14 201-208 http://www.genome.org/cgi/content/abstract/14/2/201?etoc
チャーチ研。
♭ [Hoge] Google AdSenseを始めます
tDiary.Net 運営日誌より。
♭ [Bio] Arita M (2004) The metabolic world of Escherichia coli is not small, PNAS 10.1073
有田さんの「大腸菌の代謝ネットワークはそんなにスモールではない」論文。
2004-02-04 [長年日記]
♭ [OS] ファイル同期ツール Unison File Synchronizer
GPL で配布。
HFS+のリソースフォークはまだ扱えないのですね。OSX での利用法については、FAQ を参照のこと。
2004-02-05 [長年日記]
♭ [Bio][eTOCs] NAR 32(2)
- RNase H2 of Saccharomyces cerevisiae is a complex of three proteins
Ho-Sang Jeong, Peter S. Backlund, Hao-Chia Chen, Alexander A. Karavanov, and Robert J. Crouch
Nucl. Acids. Res. 2004 32: 407-414. - The major 5' determinant in stop codon read-through involves two adjacent adenines
Sanaa Tork, Isabelle Hatin, Jean-Pierre Rousset, and Celine Fabret
Nucl. Acids. Res. 2004 32: 415-421.
終止コドンの上流近傍の6カ所を改変したオリゴマーでリードスルーを調べると、上流近傍配列の違いだけで、翻訳リードスルー効率に最大16倍の違いがでた。PサイトでのmRNAの構造がリードスルー効率を決めていると提案している。(これはラージスケールに発展できるネタですね。) - Exon repetition: a major pathway for processing mRNA of some genes is allele-specific
Roberto Rigatti, Jian-Hua Jia, Nilesh J. Samani, and Ian C. Eperon
Nucl. Acids. Res. 2004 32: 441-446.
ゲノムではタンデムリピートしていないエキソンが、mRNAではタンデムリピートしていることを exon repetition という。アレル特異的に制御されているたしい。(こんな後転写制御があるんですね。こまりますね。EST がマッピングできません、みたいな)
2004-02-06 [長年日記]
♭ [P]
あぁ。 なんかしんどい。 走り幅跳びなのに、助走だけでちからつきる感じ。転んだわけではない。
名前を間違えられると萎えますな。
簡単過ぎるモデルなんだから、あまり大きいこといってはいけません。
♭ [Bio][Bi] Standalone PSORT-B for Linux Released!
グラム陰性バクテリアのタンパク質局在予測ツール PSORT-B のスタンドアローン版のリリース。 GPL で配布。 NCBI BLAST, HMMTOP がローカルにインストールされている必要がある。 (from PSORT-B ML)
- Download: <URL:http://www.psort.org/psortb/downloads/index.html>
- PSORT-B: <URL:http://www.psort.org>
HMMTOP がいわゆるアカデミックフリーなライセンスで、プログラムの取得には作者にメールでリクエストする必要があるので、すぐには試せない。
♭ [Hoge] Okasannizer - 「お母さん」フィルター
こんなの経由して見ないように。(w
2004-02-07 [長年日記]
♭ [P] 予約完了、YTN
staff アドレスの spam が増えてきたような気がする。
「いままで「止めをさせ」といい聞かせられてきたのに、次を残してまとめろだなんて、どうしたらいいのかわからないよ」
コインランドリーにいこうとしたら、大家にばったり。 自転車を部屋の前に置くことの許諾を得る。 孫に見られないようにと釘をさされた。 両隣の空き部屋にはどちらも入居者がくるらしい。 TV アンテナのお願いもしておいた。
♭ [Bio][eTOCs] Science 303
- Robust Interactions
Lee Hartwel
, Science, 303(5659):774 - Global Mapping of the Yeast Genetic Interaction Network
Tong et al.,
Seience, 303(5659):808
酵母のすごい遺伝子ネットワーク解析。
♭ [Bio][eTOCs] Mathmatics in Biology: Science Online Special Feature
- INTRODUCTION Biology by the Numbers
G. Chin, R. Coontz, L. Helmuth - NEWS Life's Patterns: No Need to Spell It Out?
A. Cho - VIEWPOINTS Introductory Science and Mathematics Education for 21st-Century Biologists
W. Bialek and D. Botstein - VIEWPOINTS Uses and Abuses of Mathematics in Biology
R. M. May - REVIEWS Evolutionary Dynamics of Biological Games
M. A. Nowak and K. Sigmund - REVIEWS Inferring Cellular Networks Using Probabilistic Graphical Models
N. Friedman
♭ [Hoge] 議論のしかた
同サイトの同階層の ソフトウェア開発の落し穴 も興味深い。(EVOLVE より)
2004-02-08 [長年日記]
2004-02-09 [長年日記]
♭ [Bio] 公開ワークショップGenProC2004「タンパク質の立体構造がわかると何がすすむか?」
2004-02-16、東京ガーデンパレス(お茶の水)。公式なページがないので、こちらに。
誤植のようなタイトルがあるのが気になります。
♭ [Bio] W.W. ギブス (2004)崩れるゲノムの常識(下)DNAを操る未知の演出家、日経サイエンス、34(3):42-51
原題:The Unseen Genome: Beyond DNA (SCIENTIFIC AMERICAN Dec 2003)。
エピジェネティックスについて、とくにゲノムインプリンティングのレビュー。 カリピージについてわかりやすく解説。
日本語タイトルが煽り系でやや萎える。 なにが常識なのか、ほんとあやしいものだ。 できるだけ簡単なモデルでひっぱっていって、いいところで、「常識を覆す」という展開にモデルを変更しているだけ、に見えますが。それは、歴史性を無視した未来からの視点だろうか。 アカデミックサークル内の理解と、サークル外、間の理解の差異の振幅なのだろうか。
♭ [Hoge] Fire and Motion (1)
そんな日もあるさ。
2004-02-10 [長年日記]
♭ [P] V,J, YTN, プログレス、並
最近 update.rb がタイムアウトすることがたまにあるみたい。 更新はちゃんとできていますが。
投稿したそうだ。 ごくろうさまです。
吉野家で並たまごけんちん汁。
♭ [R] Data Mining with R learning by case studies
R でデータマイニングな本のページ。 データと R の code と本自体をダウンロード可能。 (R-help より)
2004-02-11 [長年日記]
♭ [P] 建国記念の日
だめだめだ。
プレゼンを一通りみてもらった。 ひさしぶりに生産的な議論ができたような気がした。 やっぱり、一人じゃできることとできなことがあるよな、と思えた。 ちなみに見ていただいたのは、隣のラボのヒトです。
♭ [Bike] タイラップ切れと変速機
フロントのブレーキワイヤを止めているタイラップが一本切れていた。 折り畳むときにへんな力がかかったのだろう、と推測。
変速機が勝手にかわってしまう。 坂をのぼるときに一番軽い 1 速にしますが、そんな負荷がかかっている最中に 2 速に勝手にはいってしまう。 グリップは動いていないので、後輪のなかで勝手にかわる模様。 よけい疲れてしまう。 調整しないといけない。
♭ [Res] セミナー資料作成中
ほとんど Keynote の練習みたいな。 オブジェクトの配置は PowerPoint より楽。 それ以外は、ちょっと大変。
任意のオブジェクトにアクセスする方法がないみたい。 重なっているオブジェクトを横にどけるか上のレイヤーから最背面へおくっていかないと、発掘できない。これは、おそらく、こまめにグループ化をおこなって、オブジェクトの数を減らせというフォースに違いない。(しまった、「おそらく〜違いない」構文をつかってしまった。)
パイチャートを作成しようとしたら、データが大きすぎたようで、数分ハングした。 アクティビティモニターで「Keynote (ハング)」とか表示されて、強制終了しようか逡巡していたら、もどったり。 iBook (Dual USB) で 640MB だともうだめかも。
2004-02-12 [長年日記]
♭ [Mac] 起動シーケンスで固まる。Cmd+s でシングルユーザモードでなぜか回復。
さてこれから出ようか、とおもっていた午前11時、何日も起動しっぱなしだった iBook (Dual USB) を再起動すると、フリーズですよ、これが。 サービスの起動まえに、よくある「リセットボタンを押すか電源ボタンを〜」のダイアログがっ。 直前の起動時になんかわるいことをしたか振り返ってみると、Bluetouth 関係のソフトウェアアップデートをしたとか、そのまえの Java と Safari のときは再起動しなかったな、とかくらいしか思い浮かばないわけで。
シングルユーザモード(Cmd+s)だと起動するわけで、journaling on だから fsck も効かず、top とか route とか netstat とか適当にみて exit したら、起動した。 もう一度再起動したら、またフリーズですよ。 きー。 よくわかりませんが、fsck か top か route か netstat をすると起動するので、このどれかが効果があったといえる。 ただ、当時は時間がなかったので組み合わせを試してはいず。
Mac OS X (Panther) のシングルユーザーモードのシェルはヒストリが効くので、かつてどこかで素の /bin/sh だったりしてかなりつらかったのが遠い昔のように、便利でした。
2004-02-13 [長年日記]
♭ [P] チケット確保、YTN、セミナー、電話、満員電車、おでん
ちょっくら品川にいってきます。 おもっていたより楽になんとかなった。
保険証がカード化されるらしい。
昨晩も寝付きがわるくて、3mg * 2 + 200ml くらいでもぜんぜんで、DVD をごそごそみてた。
今月はせんべい3枚。
電話あり。 やはり問題になるのはあれで、予想していたとおりの展開に。
セミナーは非常に興味深いものであった。 あのデータはおもしろい。 あんなデータがとれるなんて、なんてすてきなのだろうか。 今後のいろいろ展開な展開が予感される。
ああ、重傷かも。
♭ [Bio][eTOCs] BIOINFORMATICS 20(3)
- affy--analysis of Affymetrix GeneChip data at the probe level
Laurent Gautier, Leslie Cope, Benjamin M. Bolstad, and Rafael A. Irizarry
Bioinformatics 2004 20: 307-315. - Functional topology in a network of protein interactions
N. Przulj, D.A. Wigle, and I. Jurisica
Bioinformatics 2004 20: 340-348. - An ontology for collaborative construction and analysis of cellular pathways
E. Demir, O. Babur, U. Dogrusoz, A. Gursoy, A. Ayaz, G. Gulesir, G. Nisanci, and R. Cetin-Atalay
Bioinformatics 2004 20: 349-356. - Non-parametric, hypothesis-based analysis of microarrays for comparison of several phenotypes
Jeanne Kowalski, Charles Drake, Ronald H. Schwartz, and Jonathan Powell
Bioinformatics 2004 20: 364-373. - A graph-theoretic modeling on GO space for biological interpretation of gene clusters
Sung Geun Lee, Jung Uk Hur, and Yang Seok Kim
Bioinformatics 2004 20: 381-388. - Knowledge discovery by automated identification and ranking of implicit relationships
Jonathan D. Wren, Raffi Bekeredjian, Jelena A. Stewart, Ralph V. Shohet, and Harold R. Garner
Bioinformatics 2004 20: 389-398. - Metrics for comparing regulatory sequences on the basis of pattern counts
Jacques van Helden
Bioinformatics 2004 20: 399-406. - Parallel Metropolis coupled Markov chain Monte Carlo for Bayesian phylogenetic inference
Gautam Altekar, Sandhya Dwarkadas, John P. Huelsenbeck, and Fredrik Ronquist
Bioinformatics 2004 20: 407-415.
APPLICATIONS NOTES
- The Jalview Java alignment editor
Michele Clamp, James Cuff, Stephen M. Searle, and Geoffrey J. Barton
Bioinformatics 2004 20: 426-427.
♭ [Res][Bio] サンプリングデータの分布を転じてヒトの母集団の分布を論じる
ラージスケール解析のみなさまは、データの分布よりむしろその母集団の分布に興味があるわけで、いったいどのように論じているのでしょうか。 母集団を推定しているのでしょうか。
ひとつのやり方として、at least という論調がある。 サンプルサイズによらず、サンプルされたものは、サンプリングの方法によらず at least 某といえるからである。
つぎにあるやり方として、ランダムリサンプリングがある。 リサンプリングのサイズを毎回変えると Bootstrap になる。
♭ [BioRuby] PDB classes
EBI のひとが関わりだした。 近いうちに原子座標をあつかえるようになるかも。
2004-02-14 東京32 [長年日記]
♭ [P] LotR3、
先ほど束ねた一山の論文が、こつぜんとその姿をけした。 ミステリーだ。 健忘症だ。 もうだめだ。 そうして部屋のなかを、腕を組みつつ、ときおりなにか思い出すかのようにつぶやきながら、まわり続けた。 バターになってしまうかのような勢いで。 もう一度、はじめからやり直そう、とデスクに向かい、いつものように椅子に腰掛けた。 目の前にあるのはいつものPCとコーヒカップと、と視線を動かしつつ違和感をかんじた。 そう認識したときには、目前にあった PC は両手によって、デスクから離れ、その底面に接していたのがあらわれた。 ってあほですか?
♭ [Res] 問題の母集団の分布の推定
精密なモデルを構築するとそうとう大変な予感なので、bootstrap で推定してみましょう。 手間のわりには報われなさげ。 というか、スゴイ分布関数になって、解析できなくて、結局、シミュレーションしそうなの。
それはそれでそれもいいが、それを目指しつつ、そこへの確固たる筋道としてのこれこれ、ということにしたいのだが、しかし。
♭ [Bio] Ensembl ProteinDAS and GeneDAS
Ensembl がアップデートしていて、 ProteinDAS が追加されていた。 Ensembl ProteinDAS は SwissProt と InterPro のアノテーションを配っている。 リファレンスは SwissProt のペプチド配列である。 UniProt/UniParc ではない。
GeneDAS は reference sequence ではなく reference id でアノテーションを交換するプロトコル。 ここでは位置情報は意味をもたない。 現時点では、SwissProt ProteinDAS が GeneDAS の機能を有する。
2004-02-15 [長年日記]
♭ [P] 最後の晩餐
今日は追い込みか。
昨日今日は国際フォーラムで未踏15シンポジウム@国際フォーラムがあった模様。
BIP2004 が /.jp のストーリーになってるし。 やっぱり脱線しているし。
ふつーに厳しいもんだな。 いやはや。
ロックオンしているから、ずらすのに苦労するする。
♭ [Res][Bio] 母集団の分布を推定する(3)
Zavolan et al., 2003 Genome Res. 12:1290 にベイズ解析によるサンプルデータからの母集団の推定が提案されている。
はじめに問題設定:確率 P(遺伝子のスプライスフォーム数 n |観測したスプライスされた転写産物数 k)をもとめたい。
ベイズ統計では、P(n|k) は事前確率 P(遺伝子のスプライスフォーム数 n) と事前確率 P(p_1,p_2,...,p_n|遺伝子のスプライスフォーム数 n)に依存している。p_i (i in 1.. n) はフォーム数 n 個の相対頻度。 前者は、ここではスケール・プライアーであると仮定した。 P(n) は (1/n) に比例すると。 いいかえると、log(n) で一様分布になる。 後者は cDNA データセットから得られる。 ここでは一様分布を選択した。 これによって、上限を推定しようということである。 ちなみに、この事前確率をゼロにすると、下限を推定することになる。
n と p_i (i in 1..n) を与えると、おなじスプライスフォームを k 回観察する確率は sum^{n}_{i = 1} (p_i)^k となる。 ゆえに、P(k|n) 、スプライスフォーム数 n のものが k 回観察される確率、は積分によって、p_i を追い出せる。
P(k|n) = (とてもテキストで書き表せない積分) = ( n!k! )/( n + k - 1 )!
以上から、もとめたい確率 P(n|k) は、
P(n|k) = ( P(k|n)P(n) )/( sum_{n'=1}P(k|n')P(n') )
= ( (k - 1)/ k ) * ( (n - 1)!k! ) / ( n + k - 1)!
すべての遺伝子のフォーム数が 1 ならば、P(n = 1|k) = 1 -(1/k) となる。つぎに、すべてがマルチフォームならば、P(n > 1|k) = (1/k) となる。
<以下編集中>
もうね、数式かけないし。
2004-02-16 [長年日記]
♭ [Bio] Bioinformatics network cheered
The Scientist より。ヨーロッパの動向。
♭ [Bio][eTOCs] JMB 336(3)
- A New Algorithm for RNA Secondary Structure Design,
Mirela Andronescu, Anthony P. Fejes, Frank Hutter, Holger H. Hoos and Anne Condon
Pages 607-624
♭ [Bio][eTOCs] JBC 276(6)
- Subcellular Localization of Cyclic Nucleotide Phosphodiesterase Type 10A Variants, and Alteration of the Localization by cAMP-dependent Protein Kinase-dependent Phosphorylation
Jun Kotera, Takashi Sasaki, Tamaki Kobayashi, Kotomi Fujishige, Yoko Yamashita, and Kenji Omori
J. Biol. Chem. 2004;279 4366-4375
2004-02-17 [長年日記]
♭ [BioRuby] Bio::PSORT::PSORT1.remote(faa)
ってのがないのでつくることにする。 Bio::PSORT::PSORT2.remote はある。 PSORT 1 はまだまだ需要があるみたい。 PSORT 1 はいまでは SunOS でうごかせるバイナリしかないので、いつまでつかえるのかという問題があったりするが、それはそれ。
とおもってソースを読むと、がっかりするほど意味わからん。なんでこんな設計したんだ>わし。 全面的に書き換えの余寒。
2004-02-18 [長年日記]
♭ [P] CCスタート、ヤバい論文
雨男というような生まれついた属性というか係というかそんなものかも、これは。 まったくツいていない。
そうなってしまうのは仕方ないが、残念である。 時間の無駄である。 パラシュート型の方が良いのに。
がーん。 先に出されたギミ。 泣きそう。 ウツだ。
たびたび「意味がわかりません」といって差し戻すと、殺伐としてきますた。 そこはぐっとこらえて推定するのが愛でしょうか。
♭ [R] RPy 0.35 リリース
Python から R を使うためのライブラリ RPy の最新リリース。Mac OS X でのコンパイルが可能になり、 Windows でのバグ修正がおこなわれました。
♭ [Mac] iBook (Dual USB) が不調
ポインター以外フリーズしてしまうことが数時間のうちに2回あった。 /Users の緊急バックアップを行う。 で、ディスクのチェック。 ぜんぜん不具合でないのだが、謎。 でもって、すでに 6 時間以上消費しています。
2004-02-19 [長年日記]
♭ [Bio] Launching October 2004 - Nature Methods
方法論といっても化学から生命科学に限定した雑誌を創刊。 思うに、つぎの「PCR」、「RNAi」、「Microarray」や「BLAST」を掲載したいのだろう。
♭ [Bio][eTOCs] J. Bacteriol. 186(5)
- In Silico and Transcriptional Analysis of Carbohydrate Uptake Systems of Streptomyces coelicolor A3(2)
Ralph Bertram, Maximilian Schlicht, Kerstin Mahr, Harald Nothaft, Milton H. Saier, Jr., and Fritz Titgemeyer
J. Bacteriol. 2004;186 1362-1373
♭ [Mac] iBook (Dual USB) 落ちた
23:30 頃に Safari でサイトをロード中に<ポインターは動くがそれ以外の操作は受け付けない>状態に。 HD にいけない領域があってそこに触れてしまったのか、なんだろうか。 system.log にはそれらしいメッセージは無し。 手がかりが無い、やっかいだな。
♭ [OS] Mew の Wiki
できました。 FAQ を作成するためのものだそうです。 (from Mew-dist)
2004-02-20 [長年日記]
♭ [Bio][R] O'Reilly Upcoming titles
ここにあのタイトルが見当たらないのはへんですね。 へんですね。
♭ [BioRuby] lib/bio/psort.rb の改造
ワンライナーでマルチなファスタ形式の配列を PSORT1 サーバに投げてその結果を保存するの巻。
$ ruby -rbio -rpsort -rpsort/report -e '
ff = Bio::FlatFile.auto(ARGV.shift);
io = Bio::PSORT::PSORT1.imsut;
ff.each do |faa|
puts "///";
b = io.exec(faa, false);
puts b
end' hoge.faa > hgoe.psort1
Bio::PSORT::PSORT1.imsut で IMSUT にあるサーバへの接続を設定して、io.exec(faa, false) で結果をパーズしないままで得る、と。
結果をパーズして Bio::PSORT::PSORT1::Report のインスタンスを得たい場合は、io.exec(faa) だけになる。
$ ruby -rbio -rpsort -rpsort/report -e '
ff = Bio::FlatFile.auto(ARGV.shift);
io = Bio::PSORT::PSORT1.imsut;
io.origin = "plant"
ff.each do |faa|
c = [faa.entry_id];
b = io.exec(faa);
f = b.final_result;
0.upto(2) do |i| c << f[i]["prediction"] end;
puts c.join(",");
end' hoge.faa > hoge.table
origin = plant に変更して、予測の上位3位までをならべたテーブルの出来上がり。
♭ [Hoge] なかなか論文を書けない若者のために
あすはどっちだ。
2004-02-21 上総 [長年日記]
♭ [RRb] Rmath.rnorm(10000) とかで [0,1) の外の値がでる
バグかも。 昨日デモをしていたときに発見。
とおもったら、Rmath.rnorm(n, mean = 0, variance = 1) なサンプリングなので、[0,1) の区間じゃないし、まじで。 酔っぱらいの言動にが冷却機関が、これ重要。
% ruby -rrmath -e 'puts Rmath.rnorm(100000).map {|x| x.to_i }' |sort -n |uniq -c
3 -4
136 -3
2196 -2
13622 -1
68380 0
13475 1
2042 2
143 3
3 4
さておき、近いうちにソースを cvs にいれて、ウェブページもつくらなければいかんとおもった。
2004-02-22 [長年日記]
♭ [P] ks1
夢をみた。 「歴史性」についてだれかと議論していた。 言葉の意味する範囲の理解の擦り合わせに終始して、最後にはわかっていただけたようだが、なんの議論していたのかをすっかり(夢の中で)忘れていた。 それじゃ、起きているときと、ほとんど一緒じゃん。 いや、起きているときは、説得できていないことが多いので、ちょとちがう。
なんかつながらない。 ついに FW でブロックされたかも。
♭ [Hoge] ProAtlasW で某測定
天王洲アイルまで 4.8 km、恵比寿駅まで 1.6 km、大崎駅 3.4 km、芝浦埠頭 3.4 km と。芝浦埠頭からレインボーブリッジをわたっていくと 9.2 km と。
♭ [Bio] 明日死ぬつもりで生き、永遠に生きるつもりで学ぶ
しびれた。 見学美根子さんの信条。
2004-02-23 [長年日記]
♭ [P] ks2、嵐、保険証、風邪?
昨晩の嵐で、木造モルタル揺れまくり。 おかげで、富士山の雪面、東京タワーの鉄筋の一本一本が鮮明に見える。
保険証がカードになって戻ってきた。
まずい、風邪か花粉症が発症しつつある。
♭ [Q] Learn as if you will live forever. Live as if you will die tomorrow. -Mahatma Gandhi (1869-1948)
20040220#p03のは、Google 経由、ほぼ日刊イトイ新聞 -ガンジーさん。に原文を発見。 さらに、英文で検索するとさらにいろいろあり。
2004-02-24 [長年日記]
♭ [Bio][eTOCs] NAR 32(2)
- Guidelines for the selection of highly effective siRNA sequences for mammalian and chick RNA interference
Kumiko Ui-Tei, Yuki Naito, Fumitaka Takahashi, Takeshi Haraguchi,Hiroko Ohki-Hamazaki, Aya Juni, Ryu Ueda, and Kaoru Saigo
Nucl. Acids. Res. 2004 32: 936-948. - Statistical analysis of over-represented words in human promoter sequences
Leonardo Marino-Ramirez, John L. Spouge, Gavin C. Kanga, and David Landsman
Nucl. Acids. Res. 2004 32: 949-958. - Analysis and recognition of 5' UTR intron splice sites in human pre-mRNA
E. Eden and S. Brunak
Nucl. Acids. Res. 2004 32: 1131-1142.
♭ [R] Package "ref" implements references and referenceable data.frames for the S-language
R で変数の値渡しではなく参照渡しを実現するパッケージ。 大幅なメモリーの節約が期待できる。
(from R-pkgs)
♭ [Hoge] IRCつながりませんね。
つながらないから、仕事がはかどるはかどる(違う
♭ [Bio] exon の日本語訳
google 検索でのヒット数
- google://エキソン - 997 件
- google://エキソン イントロン - 489 件
- google://エクソン - 13,800 件
- google://エクソン イントロン - 665 件
- google://エキソン エクソン - 93 件
本のなかのエキソン
- ゲノム
- ヒトの分子遺伝学 第二版
- 広辞苑 第四版
- 25万語医学用語大辞典
本のなかのエクソン
- リーダーズ+プラスV2
エクソンはアメリカの会社が false-positive になっている模様。
♭ [SC] 5=========6=======-
わけあって、わけいって、昨年までグランサイズだった渋谷支店へ。 代官山経由で意外と近い。 9Fにお酒のボトルのならんだラウンジがある。 什器がちがうね。ソファーとか。
♭ [Mac] iBook (Dual USB) がフリーズ
ブラウザでページロード中にフリーズ。 18, 19 日の状況に似ている。 はやく次のマシンに移行したいよう。
本日2回目のフリーズ。 メモリーいっぱいまで使うとだめなのか、Safari の設定ファイルかなにかが触っちゃ行けないセクタにあったりするのだろうか。
♭ [R] .Rhistory は 512 行まで
とあるディレクトリに Rplots.pdf がある。 かつて、そのタイムスタンプの日に pdf() して、ごにょごにょして、 dev.off() して作ったグラフのPDFファイルである。 若干の修正を加えて、もう一度そのグラフを描く必要があった。 当然書き方を忘れているので、grep pdf .Rhistory で探してみると、ノーヒット。 そんなわけはないだろうと思い、less .Rhistory をして幾時間。 どこの .Rhistory をみても 512 行しかないことに気がつく。 試しに R を起動し、いくつかコマンドを入力して、それから終了すると、さっきまで .Rhistory の先頭行にあった履歴が消えていた。 消えちまった。
ヒストリは早めにスクリプトにしときなさいってこった。
♭ [Bio][Bi] BioSapiens Press Release
ヨーロッパのゲノムアノテーションの Network of Excellence (NoE) に 12 million Euro の予算投下だそうです。 14 ヵ国、24 のバイオインフォマティクス研究室が参加。
NoE は日本の COE に相当するのでしょうか。 印象として、COE は拠点形成ということですが、NoE は Virtual Institute で、どちらかというと特定領域研究に似ているような。
日本のバイオインフォマティクス業界的には、つぎは<システム生物学>という雰囲気ですが、ヨーロッパは<ゲノムアノテーション>であるというのが、対照的で興味深いです。 日経サイエンスのタイトル付けに似た国ごとの温度差にもにているようで(あれはアメリカとニッポンの違いですが)。
ゲノムアノテーションは DAS で交換するそうなので、すごいのが期待できそう。
Ω so [BD-Frogのあのグリーンって蓄光塗料でしたか..恐るべし]