医療・医薬品添付文書、医薬品添付文書集、医療機器、SGML、新記載要領XMLの作成、組版から各種データ作成、印刷、加工、梱包まで当社にお任せ下さい
DaikoCrea技術Blog
  • HOME »
  • DaikoCrea技術Blog »
  • XML

XML

添付文書用XML解析 2. Item.Detail要素1

■今後の予定■
1. XMLの全体像
2. Item.Detail要素1(本記事)
3. Item.Detail要素2
4. その他の副作用
5. 組成性状

…以降未定

前回のブログでは全体的な構造、主にルート直下に配置される大項目に並びについて触れました。
今回は中項目以下の内容部分の構造について実際の例を用いて解説したいと思います。

Item.Detailを用いた構造の違い

以下の様な禁忌の項目を例に解説したいと思います。

XML_ContraIndications_Sample1

SGMLの場合

上記の禁忌をSGMLで作成すると以下のようになります。

SGMLでは【禁忌】の様な大項目の項目名は、variablelabel要素等を用いて記述していました。
上記の例では「禁忌」の意味を持つcontraindications要素の直下で項目名「禁忌」を記述しています。
そして、マーキングしてある3-5行目が1つ目の項目に当たります。
serialno要素が順序番号を、item要素が項目名を、detail要素が内容を表しており、各要素が並列に配置されているのが分かるかと思います。
ここで注目したいのが1つ目の項目が3つの要素で構成されているのに対し、2つ目の項目はlow1subitem要素を含む4つの要素で構成されている点です。
並列に配置された要素を取得する為には上から順に要素名を見分ける必要がありますが、1項目当たりの要素数・種類が一定ではない為、項目の範囲を特定しにくい構造となっており、煩雑な処理が必要でした。

XMLの場合

次にXMLの禁忌の構造を見てみましょう。

まず、ContraIndications要素などの規定されている項目に関しては、別途項目名を記述しなくなりました。要素そのものが項目名を意味している為です。
XMLではマーキングしてある3-10行目が1つ目の項目を指しています。Item要素が役割を変え、個別に項目を包括するようになっていますね。
項目名を示すHeader要素、内容を示すDetail要素が一括りとなっており、Item要素が1つの項目を表すようになった為、SGMLに比べ項目の取得が容易になりました。
また、順序番号を表す要素が無くなりましたが、親にOrderedList要素を持つことで、Item要素の登場順がそのまま順序番号に相当する形式となっています。
なお、順序番号を振らない場合はOrderedList要素の代わりにUnorderedList要素やSimpleList要素を用いることで、順序番号を用いない記述が可能となっています。
これらListの名を冠する要素については説明が長引く為、別途記事を用意する予定です。今後作成予定の記事でご覧ください。

最後にLang要素に関してです。
Lang要素は使用する言語について定義しており、多言語での記述を併記する為に用意されました。
今回は日本語なので”ja”が属性値として設定されていますね。
なお、数値を用いる要素等を除き、内容を記述する際は必須の要素となります。

まとめ

今回はItem要素・Detail要素回りについて解説いたしましたがいかがでしたでしょうか?
SGMLに比べXMLは構造を意識した作りに変わっているのが窺えたかと思います。
細かい項目単位での取得が容易になって、データとしての活用がし易くなるのではないでしょうか。

次回はListの名を冠する要素のより細かい部分をみていきたいと思います。

※本記事のXMLは”xml_schema_v0.9.4.xsd”に基づき作成しています。

 

添付文書用XML解析 1. XMLの全体像

先日の通知により添付文書用のXMLのスキーマが公開されました。今までのSGMLからどのように変わったのでしょうか。今回から何度かに渡ってXMLとSGMLの違いを中心に概要をみていきましょう。
今後の改訂に向けて少しでも参考になれば幸いです。

以下今後の予定を記します。
内容については順次更新していく予定です。

なお、XMLスキーマは今後も随時更新されると考えられます。内容はあくまでも記事の掲載時の情報である旨ご了承ください。

■今後の予定■
1. XMLの全体像(本記事)
2. Item.Detail要素1
3. Item.Detail要素2
4. その他の副作用
5. 組成性状

…以降未定

XMLの全体像

今回はルート直下の要素を見て全体像を把握しましょう。

SGMLのルート直下要素

まず、今までのSGMLのルート直下の要素を見てみましょう

sgmlroot

現在PMDAのサイトにアップする際に作成しているSGMLのルート要素とその直下の要素の一覧です。
まずルート要素は「packins」、ルート直下の「添付文書番号」から「特殊記載」までは製品名等の基本情報、「警告」以降が添付文書の本文の内容、主に【】の付く項目単位で要素が構成されていますね。

SGMLの仕様だと、【組成・性状】の項目がルート直下には存在しません。これは【組成・性状】の内容は、「承認等」の項目に、含量毎に記載されているためです。
また、『紙』の添付文書には無い、「薬物動態の表」や「臨床成績の表」等の表の為の要素が存在しています。SGMLは文章の途中で表を記載する仕様になっていないので、表を表現する場合にはこれらの表の為の要素に記載する必要があるためです。

XMLのルート直下要素

それではXMLのルート直下の要素を見てみましょう。

xmlroot

ルート要素は同じく「Packins」ですが、XMLでは要素名に大文字を用いる様になっています。以降の要素名も同様で、長い要素名はかなり読みやすくなりました。「Warnings」や「ContraIndications」等変更の無い要素名は基本的にSGMLと同じ要素名を採用しています。
ルート直下の要素はSGMLと同じく、「添付文書番号」から「特殊記載」までが基本情報、以降は添付文書の本文内容という構造ですが、新記載要領に合わせて項目の追加・削除・移動があります。
「原則禁忌」や「使用上の注意」等の一部項目が無くなり、「特定の背景を有する患者に関する注意」等の項目が追加、また「使用上の注意」に含まれていた「重要な基本的注意 」等の項目がルート直下に移動されています。新記載要領対応の添付文書を作成する為に要素の構造が整理されているのがわかるかと思います。

【組成・性状】は「承認等」から分離され、「禁忌」の直後に配置されるようになりました。それに伴い【組成・性状】は今までのSGMLと記述方法が大きく変わった要素の一つです。XMLとSGMLの違いの中でも、大きな変更点になるので、具体的な変更内容、記述方法については、別途記事で詳しく見ていきたいと思います。
また、「〇〇〇の表」という項目がなくなりました。SGMLでは文章中に表を記載出来ませんでしたが、XMLでは可能になったためです。これらにより、XMLは『紙』の添付文書と同じ順番で各項目を記述する事が出来るようになりました。SGMLでは『紙』の添付文書と表示順が異なる箇所がありましたが、XMLではより『紙』の添付文書に近い表示が出来るようになりそうです。

ルート直下要素の属性

XMLのルート要素、「Packins」にはいくつか属性が設定出来ます。少しだけスキーマを見て確認してみましょう。スキーマでは「Packins」要素は以下の様に定義されています。

スキーマの読み方についてはここでは割愛させていただきます。上記の部分の大部分で、「Packins」要素に含まれる要素が設定されており、色が変わっている83行目から90行目で属性の設定がされています。
ここを見ると「Packins」要素は次の様な属性を持つ事がわかります。

  • id
  • lang
  • version
  • referenceOfPrecautionsForUse
  • referenceOfPrecautionsForHandling

SGMLとXMLの違いという意味では、「lang」属性と「version」属性はSGMLでも存在していました。「id」と「referenceOfPrecautionsForUse」と「referenceOfPrecautionsForHandling」属性がXMLで新出です。コメントを見ると「referenceOfPrecautionsForUse」は使用上の注意の教科書ID、「referenceOfPrecautionsForHandling」は取扱い上の注意の教科書IDを記述する様です。
内部で教科書の内容を用いている場合、この属性を確認すればどの教科書を参照しているか確認する事が出来そうです。

まとめ

今回はSGMLとXMLの違いとして、ルート要素と直下の要素の構造を簡単ですが確認しました。以下に要点をまとめます。

  • 要素名に大文字を使い読みやすくなった
  • ルート要素は引き続き「packins」、その他変更の無い要素名はSGMLから引き継ぎ
  • 【組成・性状】の項目は「承認等」から分離、「禁忌」の直後は配置。文章中に表を書ける様になった為「〇〇〇〇の表」の項目は廃止
  • SGMLよりも『紙』の添付文書の表示を再現しやすくなった
  • ルートの属性に教科書を示すIDを記述する属性を持つ

次回は文章の記述部分、SGMLでのitem要素やdetail要素に当たる部分をみていきたいと思います。

SGMLからXMLへの変更に伴う文字コードの違い

医薬品添付文書の記載要領が改正されるのに合わせ、医療用医薬品添付文書の届出がSGMLからXMLに変更されます。
今までのSGMLでは文字コードをShift_JISで作成することが義務付けられていましたが、XML化に伴い文字コードがUTF-8に変更される予定です。
文字コードについての細かな説明は割愛させていただきますが、Shift_JISは日本語を記述する為に作られたのに対し、UTF-8は世界中の言語に対応できるように作られた経緯があり、使用できる文字数が大幅に増えます。
多言語での記述が可能になる他、日本語でも使用できる漢字が増えます。

実際にどんな影響があるのか、軽く触れたいと思います。

【医薬品では何に影響する?】

例えば「かゆみ」を意味する「そう痒」という字は、漢字で表記すると「掻痒」「搔痒」「瘙痒」の3つの表記があります。
しかしShift_JISでは「掻」の字体しか対応しておらず、他の「搔」と「瘙」の字は使用することができませんでした。
実際に日本ジェネリック株式会社の”アカルボース錠50mg「JG」/アカルボース錠100mg「JG」”などは、添付文書(PDF)では「瘙痒」と記述されているのに対し、SGMLでは「そう痒」と記述されています。(2017/05/09時点)

PDF_HTML_Compare

PMDAの検索結果から抜粋しています(http://www.pmda.go.jp/PmdaSearch/iyakuSearch/

UTF-8では「搔」と「瘙」の字体も使用することができるようになります。
今までは、やむ追えず字体を変えたり平仮名で記述していた文字が、添付文書と同様の字体で記載することが可能となります。

Web上の表示が紙媒体の内容に近づくことが期待されます。

 

【注意事項】

過去の通知の中でUTF-8になることは通知されていますが、その中で「日本語項目でどの文字 が使用不可かは追って通知」という記述がありました。
UTF-8であるからといって全ての文字が使用できるかは不明ですので、注意して下さい。

Page 1 / 512»
PAGETOP
Copyright © Daikocrea Co. Ltd. All Rights Reserved.