テキストデータの入手方法


  1. 白井@国立神戸視力障害センター 4.9.2000 テキストデータを探しています。インターネットなどで自力で探してみましたが、見 つけることが出来ませんでした。
  2. 浦口明徳@BBA 4.9.2000 テキストデータが最終的に見つからない場合は原本を送っていただければテキスト化 します。
  3. 鈴木英征@山梨県立盲学校 4.9.2000 盲学校長会やオリエンス研究会の教科書はテキストデータがありませんが、これは著 作権の関係があるはずです。
  4. 藤川 敦志@信愛福祉協会点字出版部 4.9.2000 理療科の教科書類のテキストデータを入手なさりたいとのことですが、コンピュータ を利用して印刷された墨字にアクセスしたいということであれば、個人で OCR システ ムを導入されるのが最も簡便で、法的にも問題なく、しかも早くアクセスできる方法 かと思います。但し、お手持ちの教科書類を1枚ずつバラバラにすることになるで しょう。
  5. 白井@国立神戸視力障害センター 4.9.2000 2年前にOCRと拡大読書器を導入しましたが、時々しか使っていません。何故なら それらの器機を使って実際に調べ物をするのに大変な時間を食うからです。
  6. 藤川 敦志@信愛福祉協会点字出版部 4.10.2000 私が仕事で使っている漢字確認の方法の一部をご紹介いたします。 《1.電子ブック》 《2.データベース》 《3.ホームページ》 確か FAX で原稿を送信すると、電話で内容を読み上げてくれるサービスがあったと思 います。
  7. 小林松治@大阪府 4.10.2000
  8. 藤川 敦志@信愛福祉協会点字出版部 4.10.2000 要は、六点漢字であれ、漢点字であれ、スクリーンリーダーの詳細読みであれ、知り たい漢字が確認できればいいということであれば、妥協策として、専門書を点字で出 版する施設の側で、主要な要語については別冊の形で JIS コード付きの索引を用意す るという手があると思いますが、これはこれで大変な作業になるような気もします。
  9. 田中@BBA広報 4.10.2000 BBAでは、著者に許諾がとれたものについては、蔵書としてテキストデータをすで に持っているので、依頼があれば提供できます。現在、300タイトルを越えていま す。蔵書リストはBBAのホームページにのせています。URLは http://www2s.biglobe.ne.jp/‾BBA/ です。
    Subject: [jarvi:12808] テキストデータを探しています。 Date: Sun, 09 Apr 2000 09:14:54 +0900 From: "Shirai 白井@国立神戸視力障害センターです。  初めての書き込みです。  以下の本のテキストデータを探しています。 探している本は、  「理療概論」 全国盲学校長会(編) 医道の日本社  「病理学概論」 全国盲学校長会(編) 医道の日本社  「リハビリテーション医学」 全国盲学校長会(編) 東京ヘレンケラー協会  「理療理論」 オリエンス研究会(編) 岡山ライトハウス  「理療臨床論」 オリエンス研究会(編) 岡山ライトハウス  インターネットなどで自力で探してみましたが、見つけることが出来ません でした。  どなかたご存じの方は、URLなど、お教え下さいますよう御願いします。 ページの最初に戻る
    Subject: [jarvi:12809] RE: テキストデータを探しています。 Date: Sun, 09 Apr 2000 09:54:35 +0900 From: uraguchi@muh.biglobe.ne.jp 浦口@BBAです。 白井@国立神戸視力障害センターさんへ テキストデータが最終的に見つからない場合は 原本を送っていただければテキスト化します。 ただし、数人で依頼物のテキスト化をしていますので 結構手がいっぱいだったりしますので いっきに全部をテキスト化できません。 1冊ずつ完成していくという形になります。 まあ、大見得切れるほどの能力はないのですが BBAを利用するというのも一つの選択肢に 入れておいてくださればと思います。 依頼される場合はEMAIL下さい。 ページの最初に戻る
    Subject: [jarvi:12811] Re: テキストデータを探しています。 Date: Sun, 9 Apr 2000 11:00:01 +0900 (JST) From: mayu-suzu@fuji.email.ne.jp  鈴木英征@山梨県立盲学校です。 Reply uraguchi@muh.biglobe.ne.jp's message: > テキストデータが最終的に見つからない場合は > 原本を送っていただければテキスト化します。 > > ただし、数人で依頼物のテキスト化をしていますので > 結構手がいっぱいだったりしますので > いっきに全部をテキスト化できません。 > 1冊ずつ完成していくという形になります。  盲学校長会やオリエンス研究会の教科書はテキストデータがありませんが、 これは著作権の関係があるはずです。  少なくとも、理教連でも盲学校長会に対して要望していることは確かですし 、現状ではデータがないということにご注意いただきたく思います。  また、これらの教科書は出版部数も少ないことから、データが出回るように なると、出版社の売り上げが下がるということにもなり、大きな問題となりま す。(出版社だって小規模です。)  なお、オリエンス研究会でも全くデータを公開していませんし、データが出 回ることは望んでおりませんので、その当たりもご注意いただければ幸いです 。 > BBAを利用するというのも一つの選択肢に > 入れておいてくださればと思います。  有り難いお言葉です。  著作権をクリアーできたものでもお願いしましょうか。 ページの最初に戻る
    Subject: [jarvi:12816] Re:テキストデータを探しています。 Date: Sun, 9 Apr 2000 12:56:37 +0900 From: 藤川 敦志  こんにちは。信愛福祉協会点字出版部の藤川です。  白井さんのメッセージにコメントさせていただきます。  理療科の教科書類のテキストデータを入手なさりたいとのことですが、コン ピュータを利用して印刷された墨字にアクセスしたいということであれば、個人 で OCR システムを導入されるのが最も簡便で、法的にも問題なく、しかも早く アクセスできる方法かと思います。但し、お手持ちの教科書類を1枚ずつバラバ ラにすることになるでしょう。  そこまでする必要があるわけではなくて、例えば通常の大きさの文字では読み づらいということでしたら、拡大読書器あるいは拡大読書機能のある OCR シス テムを使われるといいでしょう。  それとも違って、視力低下と触読能力の不足のために墨字も点字も読めないと いうことでしたら、録音された教科書を利用される手もあるかと思います。  いずれにしても、一番安全で安上がりで速い方法を検討されてはいかがでしょ うか。  以上、ご参考になれば幸いです。 ページの最初に戻る
    Subject: [jarvi:12819] RES テキストデータを探しています。 Date: Sun, 09 Apr 2000 17:23:26 +0900 From: "Shirai 白井@国立神戸視力障害センターです。  山梨県立盲学校の鈴木英征さん、  BBAの浦口さん、  信愛福祉協会点字出版部の藤川さん、 早速のRES、ありがとうございました。  2年前にOCRと拡大読書器を導入しましたが、時々しか使っていません。  何故ならそれらの器機を使って実際に調べ物をするのに大変な時間を食うか らです。  なかなか見える人には判ってもらえないのが残念です。  OCRを手に入れた最初の頃は、はりきって本をバラバラにして、読み込ま せていましたが、ある日、自分がそれをするのに膨大な時間を費やしているの に気づきました。  そのうえバラバラにした本の10分の1ほどををパソコンに取り込んだ時点 で、私のパソコンはパンク寸前になりました。  普段は点字で勉強をしていますが、どうしても漢字を調べる必要があります。  対面朗読も利用しているのですが、時間が足りません。  以前にパソコン関係の本をフロッピーで買ったことがあるのを思い出しました。  そこで、何もタダでとは言いませんが、原本と同じ価格でテキストデータを 手に入れられる方法があるかも知れないと考えて、このMLにのせてみました。  著作権のことを考えると理解できない訳でもないのですが、なんだか、あんまりすっ きりしません。でも、もうあきらめます。  みなさん、色々なご意見どうもありがとうございました。 ではこのへんで。 ページの最初に戻る
    Subject: [jarvi:12827] Re:RES テキストデータを探しています。 Date: Sun, 9 Apr 2000 22:40:31 +0900 From: 藤川 敦志  こんばんは。信愛福祉協会点字出版部の藤川です。  あまりフォローにはなりませんが、私が仕事で使っている漢字確認の方法の一 部をご紹介いたします。 《1.電子ブック》  医歯薬の「最新医学大辞典」の電子ブック版は 150MB 程度ですから、最近の パソコンの HDD を圧迫することはないのではないかと思います。ノートパソコ ンでいつでも検索できるようにしています。 《2.データベース》  NIFTY か JUSTNET のメールアカウントをお持ちなら、朝日新聞社のデータ ベース「朝日コムパーフェクト」は、最近1年間の朝夕刊記事と「知恵蔵」の検 索が、月額500円の基本料+1件あたり20円または80円で入手できます。エイ ズ、ピロリ菌、C型肝炎など比較的新しい情報もありますし、新聞記事中には医 学教養的なものや医療相談のようなコーナーもありますから、調べたいことが割 と簡単に解決することもあります。 《3.ホームページ》  yahoo で検索してみると、各地の整形外科、眼科、精神科、産婦人科の医院や 病院のホームページがあり、主に患者さん向けに医療情報を提供している所もか なりあるように思います。リハビリや鍼灸関係となると自信はありませんが、 キーワードの入れ方次第で有益な情報が手に入るのではないでしょうか?   これらの手段で教科書そのものの漢字表記をカバーし切れるとは思いません が、何割かは補えるのではないでしょうか。  あと、私は利用したことがありませんが、確か FAX で原稿を送信すると、電 話で内容を読み上げてくれるサービスがあったと思います。確認したいページが わかっていれば、こうしたサービスを利用すれば対面朗読よりも早く知りたい情 報が得られるかもしれません。  もっとストレートに、著作権者に事情を話して了解を得た上で拡大写本を作っ てもらうという手もあるとは思いますが……。  以上です。あまりお役に立たなくて申し訳ありません。 ページの最初に戻る
    Subject: [jarvi:12831] Re: RES テキストデータを探しています。 Date: Mon, 10 Apr 2000 05:48:27 +0900 From: 小林 松治  おはようございます、大阪の小林松治です。  国立神戸視障センターの白井さん、 確かに今すぐは難しい問題があるかも知れませんが、 けっして諦めないでください。  私は漢点字(8点)のユーザーです。 テキストデータを、通称「ハイブレール」と呼んでいる ピンディスプレー付きの「点字パソコン」を使って 漢点字として触読しています。 ですから私も、あらゆる本がテキスト化される日を待ち望んでいます。 白井さんもおっしゃいますように、OCRでデータ化することは 時間と労力を要し、調べものには向きません。 おまけに今のOCRの読み取り確度は 一番読み取りやすい単行本でも誤読が多々有ります。 そこで私は、OCRで読み取ったデータと原本を 身近なボランティアのかたに預けて、修正をお願いしています。 しかしこれも日数がかかり、ものによっては間に合いません。 ですから、浦口さんがお教えくださった 「BBA」のような所があると大変助かります。 著作権の問題につきましては、 「点訳」が一応フリーになっているように、 点字使用者に限っては認められるようにならなければならないと思います。 そういう必要性が生まれてくる背景には、 (仮名ばかりの)点字の欠陥が潜んでいると思います、 「点訳する」ということは、元々漢字仮名交り文の日本語文を わざわざ仮名ばかりにして、意味不明状態を作り出すことなのです。 その点から言うと、点字出版所が漢点字出版を行なえば、 そして点字ユーザーが漢点字を学べば、問題は解決するわけですが……。 しかし今の現実では私も、BBAのようなところを捜し求めています。 お願いした際には、浦口さん、どうぞよろしくお願いいたします。 その他にも、文学書では、パピレスや青空文庫もあるようですが、 専門書や教養書については、 捜している人はよく聞きますが、情報は中々見つかりません。 ページの最初に戻る
    Subject: [jarvi:12834] Re:RES テキストデータを探しています。 Date: Mon, 10 Apr 2000 09:12:54 +0900 From: 藤川 敦志  信愛福祉協会点字出版部の藤川(但し個人資格で発言)です。  大阪の小林松治さんのメッセージに対してコメントさせていただきます。  あれからいろいろ考えてみたのですが、 jarvi-ml のような開かれた場では、 著作権の問題を抜きにしてテキストファイルの扱いに関する意見を述べるのは難 しいことです。  パソコンを利用した漢字かな交じり文書の読み取り/印刷がかなり自由にでき るようになった時代に、点字出版施設がカナ点字だけ扱っていていいのかと言わ れれば、グーの音も出ないところはあるのですが、八点両面印刷のシステムが あったところで、それを利用して六点漢字や漢点字を用いた(手作業による)点 訳のできる技術者は滅多にいないのではないでしょうか。テキストファイルから 六点漢字や漢点字への自動変換を行なうには、肝心のテキストデータを「著作権 をクリアした形で」入手する必要があるわけで、そのようなテキストが入手可能 であるなら、そもそも点字出版施設がわざわざ漢点字や六点漢字に変換する必要 性はあまりないことになります。ここで私の頭は堂堂巡りになりました(笑)。  要は、六点漢字であれ、漢点字であれ、スクリーンリーダーの詳細読みであ れ、知りたい漢字が確認できればいいということであれば、妥協策として、専門 書を点字で出版する施設の側で、主要な要語については別冊の形で JIS コード 付きの索引を用意するという手があると思いますが、これはこれで大変な作業に なるような気もします。あまり書いていると自分の首を絞めそうなので、これに て失礼いたします。 ページの最初に戻る
    Subject: [jarvi:12835] Re: RES テキストデータを探しています。 Date: Mon, 10 Apr 2000 10:12:58 +0900 From: "田中 律子" 小林松治様 BBA広報の田中です。 >そこで私は、OCRで読み取ったデータと原本を >身近なボランティアのかたに預けて、修正をお願いしています。 >しかしこれも日数がかかり、ものによっては間に合いません。 >ですから、浦口さんがお教えくださった >「BBA」のような所があると大変助かります。 >しかし今の現実では私も、BBAのようなところを捜し求めています。 >お願いした際には、浦口さん、どうぞよろしくお願いいたします。 >その他にも、文学書では、パピレスや青空文庫もあるようですが、 >専門書や教養書については、 >捜している人はよく聞きますが、情報は中々見つかりません。 BBAについて若干ふれさせていただきます。 BBAでは、著者に許諾がとれたものについては、蔵書としてテキストデータを すでに持っているので、依頼があれば提供できます。 現在、300タイトルを越えています。 蔵書リストはBBAのホームページにのせています。 URLはhttp://www2s.biglobe.ne.jp/‾BBA/ です。 また、個人からの依頼入力というかたちで、テキストデータ作成や OCRデータ修正によるテキスト化もしています。 ただし、著作権諸々の問題があるので、この場合は個人依頼です。 現在、依頼入力を希望される方は浦口さんまで原本を送ることになっています。 また、初回の利用時に誓約書(BBA指定のもの)・身体障害者手帳のコピー または眼科医の証明書を提出していただくことになっています。 依頼をされる方、問い合わせ等は、浦口さんまでメールにてお願いします。 ページの最初に戻る
    JARVI/ML Technical Digest Indexへ