2つのcsvデータからほしいものだけをとる
- csvをopen()を使って開く。reader()に渡す。
- redaerオブジェクトはforループを使って各行をリストにする。
- 要素も行も条件分岐につかう。
- 各行の要素をリストにすることもできる。
- index()メソッドはインデックス番号を返す。インデックスのリストを作ることもできる
- enumerate()メソッドはインデックスと要素にそれぞれわけてイテレーションすることができる
- zip()メソッドは複数のリストから要素を順番にとってリスト化することができる。
むずかしすぎたので独り言
やろうと思えば2つのcsvからほしいものだけをとってきて、見やすい形にすることができる。まずはじめにもたければならない動機として「何のデータがほしいか?」という欲求はいる。もしくは、「問い」。その両方のどちらかが欠けている場合はデータラングリングはしないという選択肢も有りかもしれない。
データそれ自体は何かに生かす方法を知らない限りは、人の役には立たない。
だが、データ整形を行うプロセスは「なんの意味ももたないか・・・」と問えば決してそんなことはないと思う。とにかく「何だったのか」というのはぼんやりとでもつかんでいたほうがよい。
やはり目的のないデータラングリングは机上の空論かもしれない
コードをみていておもったが、2つ以上からなにかがほしいとなった場合は、どれか基準を決めなければならない。目的がなくても基準は決められるかもしれないけど、自分が何をやりたいかというのは原動力として持っていたほうがよい。少なくともなにがしたいか、とりたいか、というのは前提としてあったほうがいいと思う。
一言でいえばコード読めませんでした。
データを整形することに時間はかけられない
別に時間をかけてもいいかもしれないけど、時間がかかるということは、プログラミングをやっている意味がないと思う。まずはあるのはできるだけデータ整形に時間をかけないということ。結局スクリプトが長くなってしまうと何をやっているかわからなくなる。確認できるなら、形を確認しながらやったほうがはやいかもしれない。
ということはプログラムはやはり小分けして処理をしたほうがよいかもしれない。
コメント