新HSKの単語をAnkiで覚える!単語帳の作り方

Ankiで使う単語データをどこから?

単語覚えるのがダルいので、アプリ使うことにした。前にP-study使ったことあるんだけど、今回は移動時間に使うことを想定し、Ankiにした。Androidだとアプリ無料。

Anki - powerful, intelligent flashcards

ここで、問題になるのは単語データをどこから持ってくるか?ということで、これはググればすぐに見つかった。

HSK Lists 2010 | Lingomi Blog

ここで、csvでDLできる。しかし、このデータは英語で、日本語訳がない。英語で覚えるのもいいけど、ここはやはり日本語が欲しいところだ。

日本語訳はどこから?

ざらっとググれば、Pinconvというアプリを使って日本語訳を用意した人がいるみたい。しかし、残念ながら同じ手法は取れなかった。というのも、Pinconを使って日本語訳を用意する場合、プラグインが必要なんだが、そのプラグインが手にはいらないからだ。これは仕方なしということで、他の方法をとることに。

これもググると分かるんだが、VBScriptでデータをスクレイピングしている人がいた。しかも、ソースを公開してたのでDLした。VBScriptは触ったことが無いんだけど、なんとなくで動かしてると、出来た。でも遅い。用途がたぶん違う。この作業にに1.5日かかってしまった。気を取り直して、Javaでソースを焼き直すことに。

Javaでスクレイピングするということで、jsoup Java HTML Parser, with best of DOM, CSS, and jqueryを使うことに。良くわからんがフィーリングで使えて、便利。スクレイピング後も、取得できなかった単語を手作業で準備したり、Ankiで使うためのデータを整えたり、音声を用意したりで、やたら時間がかかった。漢字、ピンイン、品詞、意味、音声、全て整えたが、疲れて使う気がしない・・・。

(余談)エクセルからUTF-8のテキストを作るには

Ankiにインポートするテキストファイルは、UTF-8じゃないとだめ。で、エクセルファイルからどうやってUTF-8のテキストファイルを作るか?これは意外と簡単。

エクセルで保存するダイアログでファイルの種類をUnicodeテキスト(これはUTF-16?だったかな)にして保存。できたtxtファイルを秀丸で開いて、保存ダイアログでエンコードの種類をUTF-8にする。以上。秀丸で開いてファイル->エンコードの種類から変更したら化けたので、保存しないとダメなんだと思う。

(余談)ピンイン書き取りにも使える?

完成後に少し触って思ったんだけど、表カードに漢字と音声おいとけば、音からピンインを書き取る練習できそう。声調の聞き分けもトレーニングできそうだ。

コメント

このブログの人気の投稿

ロワシーバスでオペラまで行った後、タクシー乗るのはここがお勧め!

おすすめのシステム手帳!ダヴィンチのロロマクラシックは高品質!!

日本語と中国語の両方を上手く表示できるフォント探し