ITエンジニアの種籾(たねもみ)

IT技術とか株式投資とか。

株式投資のためのEDINETの利用

2020年 07月 27日

目次

株式投資のポータルサイトを作ろうと思い、企業の業績などの情報をどこから入手したら良いかリサーチしていたところ、EDINET にたどり着きました。

EDINET(Electronic Disclosure for Investors’ NETwork・エディネット)は、金融商品取引法上で開示用電子情報処理組織と呼ばれる、内閣府の使用するホストコンピューター・提出会社の使用するコンピューター・金融商品取引所(及び金融商品取引業協会)のコンピューターを結んだ、同法に基づく開示文書に関する電子情報開示システムである。 https://ja.wikipedia.org/wiki/EDINET

どの様式を取得したいか

企業の業績を追跡するために以下の2つを入手したいと考えています。

  • 有価証券報告書 : 決算の確定数値(年度が3ヶ月以内、四半期が 45 日以内)
  • 決算短信 : 速報版のため仮の数値(45 日以内)

ですが、EDINET から入手できるのは有価証券報告書だけでした。 しかも、過去5年ぶんしか残っていません。。。

決算短信は TDnet にあるようです。

TDnet(ティー・ディー・ネット)とは、東京証券取引所の運営する適時開示情報伝達システム(Timely Disclosure network(タイムリー・ディスクロージャー・ネットワーク))のこと。 https://ja.wikipedia.org/wiki/TDnet

TDnet にはさらに1ヶ月分しか残ってないようです。

ここまでを整理

  • 有価証券報告書

    • EDINET から入手
    • 提出期限は決算から年度が3ヶ月以内、四半期が 45 日以内
    • 残っているのは過去5年
  • 決算短信

    • TDnet から入手
    • 提出期限は決算から 45 日以内
    • 残っているのは過去1 ヶ月

速報性を考えると、決算短信の結果を見ないといけないです。 四半期は有価証券報告書、決算短信ともに 45 日以内なので、注意するのは年度分の1年に1回のタイミングです。

また、有価証券報告書のほうが正確のなので、たとえ決算短信が発表されても、後からでてくる有価証券報告書の数値のほうが正しいです。

とりあえず、過去数年間のデータベースを作るために EDINET の有価証券報告書に専念します。

将来像

  • 最初に1回

    1. EDINET に存在するすべての、有価証券報告書から過去の業績などの企業情報のデータベースを作る
  • 運用開始したら週1回

    1. TDnet の決算短信を監視して、あれば仮の業績として取り込む
    2. EDINET の有価証券報告書を監視して、あれば FIX した業績として取り込む

ますたはやはり、有価証券報告書という考えです。

年度の報告時のみ、有価証券報告書は3ヶ月ギリギリが多そうなので、45 日以内の決算短信で仮取り込みします。

年度以外の四半期は、有価証券報告書が数日遅れる程度のようなので、決算短信の意味ないかもしれないですが、 どうせ年度のために自動化することになるので、決算短信も取り込みます。

有価証券報告書のデータフォーマット

通常、企業の IR 情報からダウンロードできるのは PDF ですが、その PDF を生成する元ネタが XBRL というフォーマットで作られています。

XBRL(eXtensible Business Reporting Language)は、拡張可能な事業報告言語の意で、財務諸表などのビジネスレポートを電子文書化することでそれらの作成の効率化や比較・分析などの二次利用を目的として、XML の規格をベースに作られた言語である。 https://ja.wikipedia.org/wiki/Extensible_Business_Reporting_Language

このフォーマットやばそうです。。。

やばいというのは簡単に理解できそうもないという意味で。。。

基礎は XML なので、テキストからメモリへ読むことは簡単そうですが、意味まで追跡するのが大変そうです。 例えば、今期の売上は?という値を取り出すのが簡単ではなさそう。。。

救いは決算短信も XBRL に置き換わっているので、有価証券報告書を乗り越えれば決算短信を読めるようになるのも敷居が低いかもです。

今後

次は、EDINET から有価証券報告書をダウンロードしてみたいと思います。

以上です。

広告