TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025101231
公報種別公開特許公報(A)
公開日2025-07-07
出願番号2023217920
出願日2023-12-25
発明の名称「文脈ベース」、文関連装置
出願人株式会社ジェーエフピー
代理人
主分類G06F 40/253 20200101AFI20250630BHJP(計算;計数)
要約【課題】文書や発言内容などの文章の文脈において語句の用法の適切さに関して、「周辺文脈」を比較する方法を提供する。
【解決手段】方法は、「全域文脈」を提唱する。文が連言で続く任意の文の束を単位文脈と定義する。単位文脈の連言が、文書の先頭から末尾まで続いているとき、それを全域文脈と定義する。この全域文脈の中に、仮に文「p」と否定「¬p」が潜んでいるとき、全域文脈「p∧、、∧¬p∧」は矛盾しているといえる。
【選択図】図6
特許請求の範囲【請求項1】
(1.1) 自然言語からなる文を、自然文と呼ぶこととし、
(1.1.1)自然文の集まりを文章と呼ぶこととし、
(1.2)前記文章の中の、すべての文から、単位文と接続関係語句が順序をもって抽出され、
(1.3)その後、前記順序におおむね従い、抽出された前記単位文と前記接続関係語句とを再構成することで、単位文関係体がつくられ、
(1.3.1)前記単位文関係体に対して、人が単位文や接続関係語句を用いて、追加、修正でき、
(1.3.1.1)追加、修正されたものを単位文構造体と呼ぶこととし、
(1.3.1.2)前記単位文構造体において、単位文どうしが、論理推論でいう連言で、結合された集合を単位文脈と呼び、
(1.4)前記単位文構造体から単位文脈を取り出すことを文脈抽出と呼び、
(1.5)前記単位文脈を作る規則に従う新たな単位文脈を作ることを文脈作成と呼び、
(1.6)前記単位文脈を単位文脈ごとに、語句や文の正誤を検査することを文書検査と呼び、
(1.7)前記単位文脈構造体に対して、単位文の連言で検索をすることを文脈検索と呼び、
(1.8)以上の前記文脈抽出、前記文脈作成、前記文脈検査、前記文脈検索を行うことのできる、文脈に基礎を置く、いわば「文脈ベース」の、文関連装置。
続きを表示(約 3,800 文字)【請求項2】
(2.1)前記単位文に関していえば、
(2.1.1)前記単位文は、対象を表現する対象語句と、前記対象の属性を表現する属性語句からなる文であり、
(2.1.2)前記対象語句と前記属性語句は、前記文章の自然文の中から抽出される語句であり、
(2.2)次に、前記接続関係語句に関していえば、
(2.2.1)前記接続関係語句は、前記単位文を接続する働きをし、
(2.2.1α)というのも、前記接続関係語句は前記自然文の接続詞などの文どうしを関係づける表現に相当するからであり、
(注記:同階層の行の概念に対して、α、βなどの記号を付記している。以下同様。)
(2.2.2)さらに、前記接続関係語句の接続機能は、論理推論の連言、含意、そして否定の機能を持ち、
(2.2.3)前記単位文関係体は、前記接続関係語句の各機能により、前記単位文どうしが、連言、含意、否定で結合されたものを指し、
(2.3)次に、前記「論理推論でいう、連言で結合された」の「連言で結合」に関していえば、
(2.3α)以下に述べる前件、後件は、いずれも単位文であり、単位文を記号Uなどで表すとして、
(2.3β)また、論理推論の連言を記号「∧」、含意を記号「⇒」で表現するとし、
(2.3.1)単位文どうしをつなぐ接続関係語句が連言の場合には、
(2.3.1.1)前記単位文どうしは、前記単位文脈を構成し、
(2.3.1.1.1)またそれゆえ、前記単位文どうしは、同じ経路にあると比喩でき、
(2.3.2)他方、含意の前件(Aとする。)とその後件(Cとする。)においては、
(2.3.2.1)前記含意の前件Aが真であるときには、
(2.3.2.1.1)前記含意の前件Aは前記後件Cと連言関係で結ばれ得、
(2.3.2.1.2)かつ、本発明においては、偽である文が文書には存在してはならないと仮定するので、
(2.3.2.1.2.1)前記含意の前件Aと前記含意の後件Cの含意の関係「A⇒C」が、連言の関係「A∧C」となり、
(2.3.2.1.2.1α)この、含意を条件付きで、連言と等価と見なしうる方式を、
(2.3.2.1.2.1β)「含意と連言の条件付き等価」方式と呼ぶこととし、
(2.3.2.1.2.1.1)したがって、前記含意の前件Aと前記含意の後件Cは、単位文脈を構成するといえ、
(2.3.2.1.2.1.2)それゆえ、前記含意の前件Aと前記含意の後件Cは、同じ経路に在ると比喩でき、
(2.4)次に、前記単位文構造体に関していえば、
(2.4.1α)以下に述べる前件は、いずれも単位文であり、
(2.4.1β)また、記号「¬」は単位文の否定を表すとして、
(2.4.1)前記単位文構造体の中にある前記接続関係語句が含意の場合に、
(2.4.1.1)含意I1の前件A10に対応して、前記Aを否定する前件「¬A10」が存在した場合には、
(2.4.1.1.1) 前記¬A10を前件とする、前記含意I1とは別の含意I2が存在することになり、
(2.4.1.2)他方、前記前件¬A10が存在しなかった場合には、
(2.4.1.2.1)人が恣意で前記前件¬A10を作ることができ、
(2.5)次に、前記文章に関していえば、
(2.5.1)前記文章を元に別途単位文構造体がつくられる場合には、
(2.5.1.1)前記文章を「元の文章」と呼ぶこととし、
(2.5.1.2)また、前記単位文構成体においては、
(2.5.1.2.1)前記単位文を、行ごとに配置し、
(2.5.1.2.2)前記単位文に固有の行番号などを割り当てる番地化機能を持ち、
(2.5.2)前記単位文が取り出される前記元の文章においても、
(2.5.2.1)文章を、通常の文法でいう単文の単位に、番号を割り当てるなどして、
(2.5.3)前記単位文の番号と前記元の文章の単文などの番号と対応づけがなされ、
(2.5.4)前記元の文章が、文書全体を指す場合には、
(2.5.4.1)前記文書全体が、章、節などの項目ごとに構成されているときには、
(2.5.4.1.1)各項目の文章も個々に単位文構造体となっているとして、
(2.5.4.1.1α)この項目別の単位文構造体を「項目別単位文構造体」と呼ぶこととし、
(2.5.4.1.2)前記文書全体に対応する、すべての前記項目別単位文構造体において、個々の前記項目別単位文構造体を超えて横断的に、個々の前記項目別単位文構造体の中にする、各単位文が互いに連言で結ばれるならば、
(2.5.4.1.2.1)前記全体単位文構造体の先頭から末尾まで、全体を切れ目なく連続的にたどる文脈を取り出すことができ、
(2.5.4.1.2.1α)このような文脈を「全域文脈」と呼ぶこととし、
(2.5.4.1.2.1.1)しかも、前記全域文脈は個別に取り出すことができ、
(2.5.4.1.2.1.1α)そして、このような個別に取り出された文脈を「個別全域文脈」と呼ぶこととする、
【請求項3】
(3.1)前記単位文構造体に関していえば、
(3.1.1)前記単位文構造体は、対応する元の文章を持つとき、
(3.1.1α)前記単位文構造体において、
(3.1.1.1)接続関係語句が含意を表現している場合に、
(3.1.1.1.1)前記含意の前件(A)を否定した前件(¬A)と前件¬Aの後件が、構造形式として、自動的に生成され、
(3.1.1.1.1.1)その後、前記構造形式に対して、人が恣意的に意味を付加して単位文を作るならば、
(3.1.1.1.1.1.1)前記元の文章とは内容の異なる単位文構造体を作って行くことができ、
(3.1.2)他方、前記単位文構造体が、対応する前記元の文章を持たないときには、
(3.1.2α)前記単位文構造体においては、
(3.1.2.1)人が構造形式を作ることができ、
(3.1.2.2)前記構造形式に対して、人が恣意的に意味を付加して、単位文を作ることができ、
(3.1.2.3)したがって、人は元の文章がなくても、独自に単位文構造体を作ることができる、
(3.2)以上の本請求項3に書かれている事項をすべて含む、請求項1に記載の該装置。
【請求項4】
(4.1)文書の検査に関していえば、
(4.1α)検査とは意味に関するものであり、
(4.1.1)文に関していえば、
(4.1.1α)2つの文が意味的に矛盾するというのは、同一文脈においてであるので、
(4.1.1.1)矛盾の検査においては、
(4.1.1.1α)検査の対象となる2つの単位文どうしを前記同一単位文脈の中で検査を行うことになり、
(4.1.1.1β)そして、検査の領域は、
(4.1.1.1.1α)特定の領域に限って行うか、
(4.1.1.1.1β)あるいは、文書全体に対して行うかがあるが、
(4.1.1.1.1)前者の場合には、任意の領域の文脈に対して検査を行うことができ、
(4.1.1.1.2)後者の場合には、前記全域文脈に対して検査を行うことができ、
(4.1.2)また、語句に関していえば、
(4.1.2α)2つの語句どうしが「おかしい」とか「変である」などを広く「曖昧」と呼ぶこととして、
(4.1.2.1)2つの語句どうしが曖昧であるのは、
(4.1.2.1.1)単位文でいえば、
(4.1.2.1.1.1)対象語句どうし、または、属性語句どうしにおいてであり、
(4.1.2.1.1.1.1α)かつ、それらは同一の文脈において、比較するのが有効であるので、
(4.1.2.1.1.1.1)2つの対象語句どうし、または、2つの属性語句どうしを、前記同一単位文脈で検査を行うことになり、
(4.1.2.1.1.1.1.1α)検査の領域は、
(4.1.2.1.1.1.1.1β)特定の領域に限って行うか、
(4.1.2.1.1.1.1.1γ)あるいは、文書全体に対して行うかがあるが、
(4.1.2.1.1.1.1.1)前者の場合には、任意の領域の文脈に対して検査を行うことができ、
(4.1.2.1.1.1.1.2)後者の場合には、前記全域文脈に対して検査を行うことができ、
(4.2)また、2つの文どうしが矛盾したり、曖昧だったりした場合、
(4.2.1)該当する単位文脈に対して、追加や修正を行うことで、
(4.2.1.1)矛盾や、曖昧さが解消されるようになる、
(4.3)以上の本請求項4に書かれている事項をすべて含む、請求項1に記載の該装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、文書や発言内容などの文章の文脈に関する。
続きを表示(約 1,600 文字)【背景技術】
【0002】
文書や発言などの意味内容を検査する場合、「文脈により意味が異なる」とはよく言われる。特許文献1では、任意の語句Aの周辺に分散する複数の語句のベクトルを測り(「ベクトル群A」と呼ぶこととする。)、他方、文章の他の箇所にあるAと文字らの異なる語句Bに関しても、周辺のベクトル群Bを測り、もし、ベクトル群Aとベクトル群Bが近似であるならば、語句Aと語句Bは文字らが異なるが、同じ意味ではないかと同義語の判定を行う。他方、文字らが同じ語句Cが他の文章の複数箇所に存在した場合、語句Cの周辺のベクトル群Cを複数箇所で取り(群C1、群C2、、、群Cn。)、群Ciが近似していないなら、文字らは同じでも語句Cの意味は、それぞれ違うのではないかとする。このような多義語の判定の仕方が考えられる。
【0003】
この方法は、語句の用法の適切さに関して、「周辺文脈」を比較するものである。一定の効果が期待できる。
【先行技術文献】
【特許文献】
【0004】
特開2023-15565
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、周辺文脈の方法では、整合性を要する文書が全体を通して、真に整合的であるのかを示すことは難しい。周辺文脈の範囲は、一般に任意の単語の前後数語とされ、範囲に限界があるからである。例えば、ある本で(交通安全の教本とする。)、冒頭に、信号が青なら渡れ、とあり、本の末尾に、信号が赤なら渡れ、とあったなら、われわれは戸惑う。矛盾していると思う。
【0006】
文書全体、あるいは、発言全体を通して文章が整合的であるかが、本発明の主要課題である。文章が整合的かとは、文章を構成する文や語句に矛盾や曖昧さがないかを指す。
【0007】
このような課題に対して、先の周辺文脈比較法を用いれば、信号青と信号赤に対する周辺の語句は、いずれも「渡れ」でベクトルは同じとなる。また両者とも渡らせる信号であるから、両者の周辺には、信号を待つとか、歩道とか、自動車とか、同じような語句が存在すると想像される。すると、周辺のこれらの語句のベクトルはほぼ同じであろうから、信号青と信号赤は、同義語と判断されそうである。しかし、そもそも青と赤の文の記述箇所は、文書のなかで遠く離れているので、比較するに足るのか、という疑問もわく。文脈が異なる場合は、意味の比較は有効ではないからである。
【0008】
われわれの戸惑いに対して、交通安全を教える教官は、2つの話、つまり信号の青と赤の話は、矛盾していないという。冒頭と末尾の話は、教本に書いてあることを1つの話の筋として読んで行けば分かるという。確かに、教本には色の識別ができない動物の話が書いてある。また、人間の色弱のことや、信号の色の決定の経緯のことも書いてある。そして、最後が、赤でも渡れる安全社会の実現という訓話めいた話となっている。
【0009】
教習の参加者は、赤が渡れ、なら、青は停止かなどと、赤と青の逆転に釈然としない思いを漏らす。教官は、青であれ、赤であれ、規則の必要性を強調したいようである。聞けば、教習の参加者はみな交通違反者で再教育のために招集されたとのこと。また、教本は半ば手製で、この訓話めいた部分は、優良運転手には無いともいう。
【0010】
教習の聴き手が特定の集団で、また、教本が手製の特別なもの、というのが気にかかる。教官の話は、文書のように、章、節、項のように分類されていれば、理解されていたかもしれない。領域が明確に分けられているからである。のちに述べる本発明の立場では、「領域」が異なることは「文脈」が異なることと説明される。教本は、実際は違反者向けの7、8ページからなる冊子だった。教官らの思いが入ったものだったようである。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
検査システム
今日
個人
記入設定プラグイン
14日前
個人
不動産売買システム
6日前
株式会社BONNOU
管理装置
19日前
キヤノン電子株式会社
名刺管理システム
今日
ホシデン株式会社
タッチ入力装置
6日前
株式会社ワコム
電子消去具
6日前
株式会社東芝
電子機器
7日前
株式会社ライト
情報処理装置
19日前
個人
パターン抽出方法及び通信多重化方法
5日前
株式会社JVCケンウッド
管理装置
今日
株式会社CBE-A
情報処理システム
5日前
大王製紙株式会社
RFIDタグ
5日前
住友重機械工業株式会社
力覚伝達装置
21日前
個人
システム、データおよびプログラム
15日前
株式会社半導体エネルギー研究所
検索支援方法
19日前
株式会社寺岡精工
顔認証システム
今日
キヤノン株式会社
通信端末
今日
株式会社半導体エネルギー研究所
会計システム
12日前
トヨタ自動車株式会社
データ収集システム
20日前
キヤノン株式会社
印刷システム
5日前
株式会社ジェーエフピー
「文脈ベース」、文関連装置
1日前
日本電気株式会社
回路装置及び制御方法
15日前
株式会社デンソー
データ処理装置
13日前
トヨタ自動車株式会社
方法
1日前
株式会社デンソーウェーブ
情報読取装置
12日前
ルネサスエレクトロニクス株式会社
半導体装置
12日前
株式会社JCA
飲食店情報紹介システム
19日前
株式会社東芝
RAID保守システム
5日前
日本電気株式会社
処理装置
7日前
株式会社キーエンス
画像処理装置および画像処理方法
今日
旭精工株式会社
料金支払システムおよび料金支払方法
20日前
株式会社東芝
RAID保守システム
5日前
ホーチキ株式会社
カードリーダー
1日前
株式会社共同経営
農企業用の経営診断システム
14日前
テイ・エス テック株式会社
車両システム
19日前
続きを見る