医療・医薬品添付文書、医薬品添付文書集、医療機器、SGML、新記載要領XMLの作成、組版から各種データ作成、印刷、加工、梱包まで当社にお任せ下さい
DaikoCrea技術Blog
  • HOME »
  • DaikoCrea技術Blog »
  • XML

XML

SGMLからXMLへの変更に伴う文字コードの違い

医薬品添付文書の記載要領が改正されるのに合わせ、医療用医薬品添付文書の届出がSGMLからXMLに変更されます。
今までのSGMLでは文字コードをShift_JISで作成することが義務付けられていましたが、XML化に伴い文字コードがUTF-8に変更される予定です。
文字コードについての細かな説明は割愛させていただきますが、Shift_JISは日本語を記述する為に作られたのに対し、UTF-8は世界中の言語に対応できるように作られた経緯があり、使用できる文字数が大幅に増えます。
多言語での記述が可能になる他、日本語でも使用できる漢字が増えます。

実際にどんな影響があるのか、軽く触れたいと思います。

【医薬品では何に影響する?】

例えば「かゆみ」を意味する「そう痒」という字は、漢字で表記すると「掻痒」「搔痒」「瘙痒」の3つの表記があります。
しかしShift_JISでは「掻」の字体しか対応しておらず、他の「搔」と「瘙」の字は使用することができませんでした。
実際に日本ジェネリック株式会社の”アカルボース錠50mg「JG」/アカルボース錠100mg「JG」”などは、添付文書(PDF)では「瘙痒」と記述されているのに対し、SGMLでは「そう痒」と記述されています。(2017/05/09時点)

PDF_HTML_Compare

PMDAの検索結果から抜粋しています(http://www.pmda.go.jp/PmdaSearch/iyakuSearch/

UTF-8では「搔」と「瘙」の字体も使用することができるようになります。
今までは、やむ追えず字体を変えたり平仮名で記述していた文字が、添付文書と同様の字体で記載することが可能となります。

Web上の表示が紙媒体の内容に近づくことが期待されます。

 

【注意事項】

過去の通知の中でUTF-8になることは通知されていますが、その中で「日本語項目でどの文字 が使用不可かは追って通知」という記述がありました。
UTF-8であるからといって全ての文字が使用できるかは不明ですので、注意して下さい。

医薬品添付文書のXML【その他の副作用について】

4月の14・18日に「医薬品添付文書記載要領改正に関する説明会」が開催され、新記載要領やXML化に関する説明が行われました。
これまでの説明から大きな変化は見られませんが、細かな仕様や具体例について触れられた点が多かったのではないでしょうか。

sinkisai_170414_document

(配布資料)

新記載要領に合わせ、XML化の仕様も進められています。
「利用者がデータ活用しやすいフォーマット」と題され、今回の説明会ではその他の副作用についての例が説明されました。(配布資料49・50ページ目)
説明会では軽く触れられただけですので、 資料49ページで使用されている物と同じ医薬品(一般名:モンテルカストナトリウム)を例に、どのように活用しやすくなったかを解説したいと思います。

sinkisai_170414_document_p49_p50

(配布資料49・50ページ)

SGML

今までのSGMLでは、その他の副作用は表形式で記載されているのではなくリストで表現されていました。
どの症状がどの頻度で発生するのか?を読み取ることは可能であり、単純に読むだけであれば十分な記述でしたが、紙の添付文書とレイアウトは大きく異なっていました。

OtherAdverse_SGML_3

XML

新たに定義されるXMLでは表としての構造を維持したまま、データを取得できるように設計されています。
列のヘッダ・行のヘッダ・内容を分けて記述し、それぞれを割り振ったidで紐付ける形になっています。 
内容が書かれているタグに、列のヘッダと行のヘッダのidが記述されているので、何行目の何列目にどの内容が記述されているのかが明確になりました。
情報を正確に取得することができ、かつ紙の添付文書に近いレイアウトを再現することが可能となっています。

OtherAdverse_XML_2

 

未だに詳細な仕様が発表されていないため一概には言えませんが、SGMLに比べかなり扱いやすくなりました。
データ形式もXMLになることで、利用可能な環境も増えるため、今後は活用される場面が増えることが期待されます。

XMLとスタイルシート

XSLTをつかってXMLを変換するサンプルを、前回ご紹介しました。

XSLTのように見た目を制御するしくみをスタイルシートといいます。スタイルシートと聞くと、多くの人はHTMLの見た目を設定するCSSを思い浮かべると思います。

実はXMLでもCSSを使うことは出来ます。しかし、XSLTとCSSの行っていることは結構違います。整理しておきましょう。

スタイルシート

Wikipediaには以下のようにあります。

構造化文書などにおける表示形式を制御するしくみ。

出典:Wikipedia

構造化文書というのは、XMLやHTMLなどのことです。XMLやHTMLの見た目を決めるしくみのことをスタイルシートと呼んでいます。

スタイルシートを使用する事で、「情報」と「見た目」を別々に管理することが出来るようになり、そのようなデータの作成が理想的です。

つまり、HTMLやXMLに「情報」を記述しておき、スタイルシートに「見た目」を定義する内容を記述しておく、というデータのつくりかたです。

そのようにつくられたデータであれば、スタイルシートを変えるだけで、同じ情報を違う見た目で表現することが出来ます。逆に、スタイルシートはそのままに、読み込むデータを変えれば同じ見た目で異なる情報を表現する事も出来ます。

また、情報を変更するときはXMLだけ変更すればよく、見た目を変更するときはスタイルシートだけを変更すればよくなるため、保守管理もしやすくなるメリットもあります。

CSSとXSLT

CSSもXSLTもこのスタイルシートの1種ということになります。CSSとXSLTもWikipediaを見てみましょう。

Cascading Style Sheets(CSS、カスケーディング・スタイル・シート、カスケード・スタイル・シート)とは、HTML や XML の要素をどのように修飾(表示)するかを指示する、W3Cによる仕様の一つ。文書の構造と体裁を分離させるという理念を実現する為に提唱されたスタイルシートの、具体的な仕様の一つ。

出典:Wikipedia

まずCSSは、HTMLとXMLどちらにも使用出来ます。

要素をどの様に見せるかを決められます。例えば、赤い文字青い文字などの様に書式を変えたり、 枠線 背景 の設定等、様々なレイアウト情報を要素に対して決められます。

おそらくほとんどのWebページで何かしらのCSSを利用してデザインしていると思います。Wikipediaのスタイルシートのページにもありましたが、単に「スタイルシート」というとこのCSSを指すことがあるくらい一般的です。

要素の出現順を変えたり、同じ要素を複数表示したり、削除したり、元の文書の構造そのものを変更するものではありません。

CSSはあくまでそこにあるデータ(情報)をどの様に表示させるかを定めるスタイルシートです。

XSL Transformations(XSLT、XSL変換)は、W3Cにより標準化されたXML文書の変換用言語である。

(略)

XSLTはXML形式の文書を変換する。XPath による選択と検索にもとづき、XML文書全体または文書の一部に対して変換を行い、別の XML 文書または表示・印刷用形式(XSL-FO、HTML、RTF、TeX 文書など)の文書を生成することができる。

出典:Wikipedia

一方XSLTは、XMLの変換言語であり、HTMLに適応しません

XSLTの機能はXMLを別のデータに変換する事です。XML内のすべての要素、又は一部の要素の情報を自由に組み合わせて、HTMLやCSVなど別のテキストベースのファイル形式としてアウトプット出来ます。

つまりCSSで行えない、元の文書の構造そのものを変換することが出来る訳です。

XSLTは、XMLを読み込み、必要な部分を必要な回数利用しながら、任意の形式で出力することが出来るスタイルシートです。

XMLにおけるスタイルシートの利用

XMLでスタイルシートを利用する際、XSLTとCSSを2段階で利用することが多いです。
まずXSLTをつかってXMLをHTMLに変換、そのHTMLに対してCSSを設定して見た目を決めるといった具合です。

XMLにおけるスタイルシートの利用例

まとめ

CSSは要素の見た目を決める仕様
XSLTはXMLの構造を変換出来る仕様
両者はスタイルシートの1種

Page 1 / 412»
PAGETOP
Copyright © Daikocrea Co. Ltd. All Rights Reserved.