- PR -

ファイルI/Oの基本ですが・・

投稿者投稿内容
norinorimi
ベテラン
会議室デビュー日: 2005/07/28
投稿数: 51
投稿日時: 2005-08-08 16:24
いつもお世話になっております。


< ID=1 AAGCAAAAGCAAAGTTGCTGTAAAACCTCTGG
Twelve of these samples were positive for the presence of
microsporidia and could be confidently identified;
11 of them were positive.
< ID=2 TCAATCTTATTCATAAG
This concept of zero interaction is equivalent
to the usual approach taken in additivity models
in the statistical literature.
< ID=3・・・・・(以下省略)

こんな感じの繰り返しの文章があり、IDと英文を取り出したいのです。
その際の条件が、
・三つのファイル(たとえばT1,T2,T3)にランダムにID,英文の組で入れること。
です。

ランダムは条件に関しては、n以上 m以下のランダムな整数 i を取得したい時に
i = (int) (Math.floor(Math.random() * (m - n + 1)) + 1) ;
とすることで解決できることを他の掲示板で学びました。

「<」に着目してファイルI/Oを試みているのですが、うまくいきません。
簡単な質問かもしれませんが、どうかアドバイスよろしくお願いいたします。

山本 裕介
ぬし
会議室デビュー日: 2003/05/22
投稿数: 2415
お住まい・勤務地: 恵比寿
投稿日時: 2005-08-08 16:35
>「<」に着目してファイルI/Oを試みているのですが、うまくいきません。
どのように試みてなにがうまくいかないのでしょう?
もうすこし問題の本質だけを抽出してシンプルに質問できませんか?
norinorimi
ベテラン
会議室デビュー日: 2005/07/28
投稿数: 51
投稿日時: 2005-08-08 16:47
インギ様
分かりづらくてすいませんでした。
自分が分からないのは、うまく英文の部分だけとってくる作業です。
試みているだけで何もアイディアが思い浮かびません。
IDをとってくる部分は解決しました。
「<」が出てきたら「<」の前の行の文章と、前に出てきた「<」の次の行のからの文章
をとる、なんていうことをうまくプログラムすればいいのでしょうが・・・。
分かりづらくてすいません。
小僧
大ベテラン
会議室デビュー日: 2005/06/24
投稿数: 122
投稿日時: 2005-08-08 16:59
こんにちは。

>なんていうことをうまくプログラムすればいいのでしょうが・・・。
なんか良く分からないのですが、ご自分で案があるんですよね?
案があるなら「それをすれば?」と思うのですが。。。

ご自分の案がダメだと思うのから投稿しているのだと思うのですが、
そうだとしたら「何がダメ」だと思うのかを書かないとわからないですよ。
書かれた設計に関するコメントが欲しいのでしょうか?

<編集>
>試みているだけで何もアイディアが思い浮かびません。
と書いてありますので、「ロジックが全く思いつかない」っていう事でしょうか?
</編集>


[ メッセージ編集済み 編集者: 小僧 編集日時 2005-08-08 17:10 ]
norinorimi
ベテラン
会議室デビュー日: 2005/07/28
投稿数: 51
投稿日時: 2005-08-08 17:09
小僧さま

<<「何がダメ」
自分の案ではなかなかプログラミングできず、
ついつい皆様のお考えを参考にしようかと・・・
甘えてすいません。
小僧さまなら、文章を取り出す場合どうされますか?
混乱しています。失礼いたしました。



MARU
常連さん
会議室デビュー日: 2005/02/16
投稿数: 35
投稿日時: 2005-08-08 17:11
何がやりたいのかの本質がイマイチ分からないのですが…。
要はファイルI/Oうんぬんではなくて、文字列解析のロジックを
プログラムしたい、と言うことですか?
がるがる
ぬし
会議室デビュー日: 2002/04/12
投稿数: 873
投稿日時: 2005-08-08 17:14
どもです。がると申します。
ちょっとだけ横から。
んっと、ぶっちゃけ「質問の意味がわからない」です。
多分ほかの人も似たような状態だと思います(苦笑
とりあえず、各単語の整理と説明から入ったほうが
よいと思います。

まず
引用:

うまく英文の部分だけとってくる作業です。


の「英文」の定義からだと思いますね。

例えば、inに
引用:

< ID=1 AAGCAAAAGCAAAGTTGCTGTAAAACCTCTGG
Twelve of these samples were positive for the presence of
microsporidia and could be confidently identified;
11 of them were positive.
< ID=2 TCAATCTTATTCATAAG
This concept of zero interaction is equivalent
to the usual approach taken in additivity models
in the statistical literature.


という文章(改行はどうなっているんだろうとかいくつか疑問
はありますが)が入ってきたとして。
取り出したいのは、例えばID=1とされている塊のばあい

引用:

AAGCAAAAGCAAAGTTGCTGTAAAACCTCTGG
Twelve of these samples were positive for the presence of
microsporidia and could be confidently identified;
11 of them were positive.


でしょうか?
それとも
引用:

Twelve of these samples were positive for the presence of
microsporidia and could be confidently identified;
11 of them were positive.


でしょうか?
また、inにはこのパターン以外で入ってくる可能性はある
んでしょうか? ないんでしょうか?

などなど。

文章という単語は、大変に便利ですが曖昧で、プログラミング
するには不向きな単語です。
その辺をもうちょっと「技術的に明快な仕様に落とす」事が
まず必要なのではないかと愚考いたしますがどうでしょうか?
小僧
大ベテラン
会議室デビュー日: 2005/06/24
投稿数: 122
投稿日時: 2005-08-08 17:23
こんにちは。

>小僧さまなら、文章を取り出す場合どうされますか?
どうって、、、
ファイル開いて Read かます、とかって意味では
もちろん無いですよね。。。
幾人かの賢者様のご指摘通り、「質問をきちんと整理」するのが大事かと。

>ついつい皆様のお考えを参考にしようかと・・・
>甘えてすいません。
まぁ、私も ( 今も ) 他の方の考えを参考にしようとしているので
大きなことは言えませんが。

>自分の案ではなかなかプログラミングできず、
「こんなソース書いたんですけどダメでした」と
提示すると熱意が伝わって Good な時もあります。

スキルアップ/キャリアアップ(JOB@IT)