当社の​コア技術

​日本語組版✖AI

日本語組版とは?

日本語を正しく美しくレイアウトするJIS規格

新聞社・出版社・印刷会社が使用しているプロ技術

新聞サンプル.png

日本語は、漢字・ひらがな・カタカナ・欧文、縦組み・横組みなど世界に稀にみる複雑な言語です。身近にある「新聞」は、大きな紙面サイズに多くの文字数があるにも関わらず、人が疲れずに情報を得ることができます。もし「新聞」が Word などの外資系ソフト(ワープロ)でレイアウトされていたら「文字酔い」して目が疲れることでしょう。まさに日本語組版とは、文字を正しく・美しくレイアウトし、情報を機能的に伝える技術です。

​<特徴>

​・国の刊行物を長年支えた組版技術

・活版時代から40年以上培ってきた独自の日本語組版ソフトの開発・販売経験

・世界で現存する数少ない日本語組版ソフト

当社のコア技術は、この「JIS規格」に忠実に再現できる日本でも数少ない日本語組版✖AIエンジンを開発したのが強みです。このエンジンは、経済産業省から「ものづくり日本大賞 優秀賞」を受賞しました。

​<当社ソフトと外資系ソフト>

​​外国語は、「行」で編集します。一方、日本語は、「升目」で編集します。分かり易い例として、小学校の時に書いた作文の升目に文字を書くことです。これが「日本語組版」です。よって、下記の図にもありますようにSymFormで編集されたもの(左)は、文字が正しく、美しく並んでいます。しかし、外資系ソフトで編集されたもの(右)は、文字配列がガタガタでただ文字を並べているだけです。

SymFormと他社との違い(SymForm).png
SymFormと他社との違い(他社).png

AI化した完全無人・完全自動
日本語組版エンジン SymForm

 
SymForm図式.png

いわゆる印刷業界で使われている「自動組版(編集)」を拡張した技術です。一般的な自動組版は、「流し込み」と呼ばれるもので、自動組版後に多少の人為的な編集(レタッチ)が必要となります。

しかし、当社のSymFormは、高度なXML技術によって自動編集した結果を細やかに自己評価し、巻き戻し再組版を行うので自動組版後の人為的編集(レタッチ)が不要となります。​この結果、DTPの削減、及び、短期間で文書制作・改訂が行うことができます。

​<他社の自動組版との違い例>

例えば、保険約款など文字物系でページ物の文書の場合、自動組版してみないと何ページになるのか分かりません。もしかすると、最終ページが数文字だけ残り大半が余白という場合もあります。この場合、他社の自動組版では、人為的な編集で最終ページに残った文字を前ページに追い込む作業を行います。

当社のSymFormでは、「〇字以内の文字が溢れた場合は、前ページに行間・文字間を調整し追い込む」といった条件を学習させることにより、人為的な作業を必要とせずに実現できます。

AI化した SymFormの実力動画

このSymFormの動画は、構造化されたXMLデータを解釈し、事前学習されたスタイルを適用し、自動組版(編集)されるだけではなく、「流した結果を自己評価(AI化)」し、巻き戻ししながら再編集している様子が分かります。このアルゴリズムにより「レタッチレス」「完全自動化」が実現できます。

「保険・約款」や「薬・添付文書」は、インデントの位置の調整など日本語文書の中でも「面倒な編集」が必要とされ編集コストの高いものです。SymFormにより外注DTPコストゼロを実現しました。

​<保険・約款>

【解説】XML構造化された約款データと付属の表データを2段組みで自動組版します。途中、1段組みの表であることを認知すると、その直前のデータを巻き戻し、平均化し左右の段組みに文字を埋めます。また、縦に長い表データを読み取り、配置しようしますが、紙面に入らないことを認知します。するともう一度表データを読み取った時に「表頭」を認知し、表を分割置きします。その時、「表頭」を自動発生させていることが分かります。データには無いものをAIが補間しています。

​<薬・添付文書>

【解説】添付文書は、保険約款と同様に、文字だけではなく、表、画像などのデータが複雑に混在し、国が規定したデザインフォーマットで出力する必要があります。このデザインフォーマットに出力するためには、多少の人為的なDTP作業が必要です。しかしSymFormでは、この添付文書も「完全自動」を実現することができます。​

当社のSymFormがもたらすもの
のワンソース・
​マルチユース&マルチデバイス

当社は、印刷媒体が得意なIT企業だからできるのワンソース・マルチユース&マルチデバイス「紙媒体(PDF)とWEB(HTML)との融合ドキュメントソリューション」が構築できます。

」とは、一つのライティングされたドキュメント(ワンソース)を人為的な作業(編集)が無く自動で、多目的に(マルチユース)、PDF・HTML出力(マルチデバイス)出来ることを指しています。

​当社のソリューションは、ドキュメントの出力、及び、ドキュメントの共有において、大幅なコスト削減、業務効率の向上をもたらします。利用するユーザは、XML知識やDTPなどのスキルを必要としません。Wordが少し扱える方や、ブログ・Facebookなどを利用している方など、誰でも簡単に利用できます。そして、出力される結果は、プロフェッショナルなPDF、HTML出力ができます。

ワンソースマルチユースマルチデバイス.png

​このビジネスモデルをソリューション化したものが

SymKnowledgeロゴ.png

です。