[jsai-fin 0212] 東証適時開示コーパスに関する限定公開実証実験の実施について

坂地泰紀 sakaji @ sys.t.u-tokyo.ac.jp
2020年 4月 23日 (木) 19:36:18 JST


SIGFINメーリングリストの皆様

東京大学の坂地と申します。


東京証券取引所に代わりまして、以下、案内をさせて頂きます。


この度、東京証券取引所(以下、東証)では、東証適時開示コーパスに関する限定公開実証実験(以下、本PoC)を実施することになりました。
本PoCにご参加いただける方を募集させていただきますので、ご案内差し上げます。

東証適時開示コーパスに関する限定公開実証実験の実施について
https://www.jpx.co.jp/corporate/news/news-releases/0060/20200416-01.html

東証は世界最大の資本市場の1つであり、2019年末時点で3,600社を超える企業が上場しています。
東証上場企業は、各社の重要な情報を適時開示資料として適時に開示する必要があり、これらの資料は東証のWebサイトで公開されています。
本PoCでは、これらの適時開示資料等から作成した対訳コーパス及びモノリンガルコーパスをサンプルとして提供します。


1.本PoC の目的
本 PoCでは、当社が東証適時開示コーパスをサンプル提供し、それらの利活用の可能性について、本 PoC 参加者からのフィードバックを受けながら、検証することを目的とします。

2. 提供データの概要
MonoTDC:
・2019年1月〜12月の適時開示資料等から機械的にテキストを抽出して構築した、日本語と英語それぞれのモノリンガルコーパス
 (ja) 文数: 49,931,840、作成元書類数: 81,892
 (en) 文数: 4,919,597、作成元書類数: 8,774
ParaTDC:
・MonoTDCをもとに機械的に構築した、日英の対訳コーパス

3. 申し込み対象
東証及び株式会社大阪取引所の取引参加者、株式会社日本証券クリアリング機構の清算参加者並びにその他東証が適当と認めた法人とします。

4. 必要書類
別添「3-1. 東証適時開示コーパスに関する限定公開実証実験参加申込書」及び「3-2. 東証適時開示コーパスに関する限定公開実証実験関係者リスト」を御提出ください。
なお、大学等の研究機関様につきましては、研究室単位でお申し込みください。

5. 申込方法
必要書類を添付の上、下記までメールにて御送付ください。
 株式会社東京証券取引所 情報サービス部 サービス企画グループ
 E-mail:inf_dev @ jpx.co.jp

<配布資料>
資料は以下のURLから取得できます。
日本語版 https://jpx-finlab-open.s3-ap-northeast-1.amazonaws.com/poc_td/docs_ja.zip
英語版   https://jpx-finlab-open.s3-ap-northeast-1.amazonaws.com/poc_td/docs_en.zip
(PASSWORD:poc-tse-timely-disclosure-2020)

1. 東証適時開示コーパスに関する限定公開実証実験実施要綱
 本PoC の申請方法、実施内容、スケジュール等について記載しています。
2. 東証適時開示コーパスに関する限定公開実証実験環境利用規約
 本PoC に参加するにあたり、遵守いただく規約です。
3-1. 東証適時開示コーパスに関する限定公開実証実験参加申込書
 本PoC に参加する場合、こちらの申込書の提出をお願いいたします。
3-2. 東証適時開示コーパスに関する限定公開実証実験関係者リスト
 上記の申込書と共に、御提出いただく書類です。
4. サンプルデータ(モノリンガル+対訳)
 東証適時開示コーパスのサンプルデータです。
5. サンプルデータに関する仕様書
 上記サンプルデータの仕様書です。


以上


<本件に関するお問合せ先>
株式会社東京証券取引所 情報サービス部 サービス企画グループ
E-mail:inf_dev @ jpx.co.jp


JSAI-FIN メーリングリストの案内