昔々あるところに

「昔々あるところに、おじいさんとおばあさんが住んでいました」という文を Google 翻訳に翻訳させ、訳文の英語を今度は日本語に翻訳させ、その日本語をまた英訳させるということを繰り返してみた。

昔々あるところに、おじいさんとおばあさんが住んでいました
Once upon a time there lived an old man and an old woman

Once upon a time there lived an old man and an old woman
かつて、老人と老婆が住んでいました

かつて、老人と老婆が住んでいました
Once there lived an old man and an old woman

Once there lived an old man and an old woman
かつて老人と老人が住んでいた

かつて老人と老人が住んでいた
Once the old man and the old man lived

Once the old man and the old man lived
一度老人と老人が住んでいたら

日本語と英語の対が何処かで収束して安定するのを期待していたが、次第に文の情報が抜け落ちていく結果になった。このあたりが、パターンマッチを学習させるだけのディープラーニングの限界ではないのだろうか。文の意味を理解して、それを翻訳するためには、ディープラーニングだけではない別の情報処理の方法が必要になってくるような気がする。

おそらく、文章を読んで理解するという情報処理にはパターンマッチ以外の処理方法が関与しているのではないだろうか。Google 翻訳では学習過程で内部的な中間言語を作り出したということだが、文字配列のパターンから抽出した中間言語と、文を読んで作り上げるイメージとは異なるもののような気がする。人間は日本語の文章を中間言語に翻訳するのではなく、日本語の文書が表す内容のモデルを作成しているようにみえる。

したがって、日本語のマニュアルなどを英文に翻訳しようと思ったら、日本語の文章のほうを工夫して、逐語的に英訳しても英文らしくなるようにすると、変換効率が上がる気がする。その場合、日本語の原文のほうが変な日本語になってしまうが、単語や熟語の検索を機械翻訳が担ってくれるので、翻訳の作業が随分楽になるのではないだろうか。

[PR]
# by tnomura9 | 2017-01-05 07:32 | 考えるということ | Comments(0)

CANDLE炉と溶融シリコンの光熱電変換を組み合わせる。

以前にこのブログで CANDLE 炉溶融シリコンベースの光熱電変換の記事を書いたが、この2つを組み合わせたらどうなるのだろうかと考えた。

CANDLE炉の利点は安全に核燃料を燃やし熱量を発生することだ。しかし、この熱を電気に変換するための機構がタービンを使う方法では構造が複雑になりすぎる。

溶融シリコンによる光熱電変換では熱と光を直接電気に変えることができるので構造が簡単になる。

この2つを結びつけたら構造が簡単で安全性の高い原子力発電が実現できるのではないだろうか。軽水炉の使用済み燃料棒はそのままでは放射性廃棄物だが、CANDLE炉や東芝の4Sの原理を使えばそのままエネルギーとして再利用できる。資源不足と廃棄物の処理が同時にできてしまう。

しかし、これらの新型炉は冷却用の媒体に扱いの難しい溶融ナトリウムを使う必要がある。これを安全な溶融シリコンに置き換えて、さらに熱光電変換で発電すれば、機構の簡素化と安全性の向上を一挙に達成できるのではないだろうか。

素人が思いついたことなので非現実的なのかもしれないが。この方法だと非常に小型の原子力発電機を作ることができる。4Sの欠点はあまり大型化できないことだが、それを逆手に取れば、非常にコンパクトでどこにでも持ち歩け、燃料の補給が数年は不要な原子力発電機を作ることも可能だ。

[PR]
# by tnomura9 | 2017-01-05 00:47 | 話のネタ | Comments(0)

思考の道具としてのAI

Google翻訳を使って、AIとの付き合い方を探ってみた。今の時点では機械翻訳にしても、完全に自動化できるということろまでは行っていないようだ。人間がAIに職を奪われてしまうのはかなり先のことの様だ。むしろワードプロセッサーがそうだったように、AIのアプリケーションは人間の能力を広げてくれる道具という位置づけがふさわしいようだ。

機械翻訳を利用することで、著者は自分のアイディアを違った角度から眺めることができる。この違った角度からの観点というのは思索にとっては重要な要件なので、これからもますます、個人的な思考活動にとっても、AIは重要になってくるだろう。

Using Google translation, I tried to explore how to get along with AI. At this time, even machine translation seems not to be said fully automated. Maybe it is quite a while before human beings are deprived of their jobs by AI. Rather, like word processors, AI applications looks suitable as tools that extend human capabilities.

By using machine translation, authors can view their ideas from a different angle. Since the perspective from this different angle is an important requirement for thinking, AI will become more and more important for personal thinking activities from now on.
[PR]
# by tnomura9 | 2017-01-04 18:48 | 考えるということ | Comments(0)

The best way to predict the future is to invent it

英語らしい英語の文例について記憶するためには、心躍る文を見つけることだ。アラン・ケイの次の言葉を読むと気持ちが高まるだろう。

The best way to predict the future is to invent it.

この言葉が発せられた経緯については、FUTURUS というサイトの


という記事に詳しい。こういう文を記憶するのは苦痛ではないし、応用範囲も広い。名言には単に英語の知識を増やす以上の価値がある。


To remember good English example sentences, the sentences should be amazing ones. Reading the next words of Alan Kay will make you feel inspired.

"The best way to predict the future is to invent it."

Regarding the circumstances in which this word was issued, on the site called FUTURUS

"The most reliable way to predict the future is to invent it ~ Alan · Kei [Scientist's Wisdom vol.01]"

It is not painful to memorize such a sentence, and its application range is also wide. Famous words are worth more than simply increasing the knowledge of English.


[PR]
# by tnomura9 | 2017-01-03 19:00 | 考えるということ | Comments(0)

Oxford Dictionaries

英文らしい英文を書くには、単語の用例をたくさん検索して、自分の意図に合致する例文を真似するしかない。Oxford Dictionariesというサイトでは豊富な例文を見つけることができる。しかしながら、多量の例文を読みこなすのが大変だが。

この記事はGoogle翻訳に直に記入して訳文がどうなるかを見ながら書いている。意味の通る英文にするには、日本語の文章をそれに合わせないといけないのに気がついた。結局のところ、日本語の発想と英語の発想の違いなのだろう。

日本語の文章を作成するときも、それを英訳するつもりなのか、日本語として自分の考えを記述するつもりなのかを分けて考えたほうがいいのかもしれない。

ちなみに、この記事の英訳には一切手をいれていない。

To write English sentences like English, you have to search a lot of examples of words and imitate example sentences that match your intention. On the site Oxford Dictionaries you can find a wealth of example sentences. However, it is hard to read lots of example sentences.

I am writing this article by directly filling in Google Translate and watching what the translation will be. To make it meaningful English text, I noticed that Japanese sentences had to be matched to it. After all, it is probably the difference between the idea of Japanese and the idea of English.

When preparing a Japanese sentence, it may be better to think about whether to translate it into English or whether to describe your own idea as Japanese.

By the way, I do not put any hands on English translation of this article.


[PR]
# by tnomura9 | 2017-01-03 06:07 | 考えるということ | Comments(0)

バックグラウンド

Google 翻訳の翻訳結果がディープラーニングを使うようになってから随分文章らしくはなってきたがまだまだ変な文章を作成してくる。これは、ディープラーニングだけでは自動翻訳の精度を上げる限界のような物があるかもしれないということを示している。

処方薬の服用法の「1回2錠1日3回服用」という文を Googld 翻訳で翻訳できなかったが、英語圏の人でも医療と関係ない人には適切な表現としては理解されていなかった。翻訳された文章が適切な英語であるかどうかは書き手や受け手の背景の状況に依存しているからだ。

技術的な文章でも分かりにくいものは、背景となる知識がかなり要求されている場合が多い。それは、その文書に基礎知識がいちいち記述されていないという意味だけではない。その文書の記述が、背景となる知識の文脈の中で理解されなければならないからだ。

表に現れる表現の意味は表に現れていない文脈に依存している。

従って、学習や授業の際にはこのバックグラウンドを意識したやり方が必要なのではないだろうか。個々の用語や概念はその用語が使われる文脈と一緒に説明される必要がある。回り道のようだが、結局はそのほうが効率の良い知識の獲得につながるだろう。

Although the translated result of Google translation improved greatly since deep learning has been utilized for it, it still creates strange sentences frequently. This indicates that there may be some limit to increase the accuracy of automatic translation by deep learning alone.

Google translation could not translate the phrase "take two tablets three times a day" in Japanese to the English phrase, but even the correct translate was not understood by an English speaking person who was not used to medical treatment. Whether the translated text is in proper English or not depends on the background situation of the writer or the reader.

In the same way, technical texts that are difficult to understand are often requires background knowledge. That does not just mean that the basic knowledge is not described in those documents, but It is because the description of the document must be understood in the context of the background knowledge.

The meaning of the expression front depends on the context not appearing in the expression.

Therefore, I think that it is necessary to take this background-conscious approach in learning. Individual terms and concepts need to be explained together with the context in which the term is used. It seems like a detour, but in the long run it will lead to more efficient knowledge acquisition.

[PR]
# by tnomura9 | 2017-01-02 17:34 | 考えるということ | Comments(0)

1回2錠1日3回服用

「1回2錠1日3回服用」を Google 翻訳で翻訳すると"1 tablet 2 tablets 3 times a day" になってしまった。

そこで、1回2錠1日3回服用を直接 Google 検索したら「薬局での英語」というサイトで、

Take two tablets three times a day after every meals.

と紹介してあった。なるほどと思ったが、英米で普通に使われているのかどうかが気になったので、今度は Google 検索で "Take two tablets three times a day" で検索したところ誰かが YAHOO! ANSWERS で、

What does '2 tablets 3 times a day mean?'

と質問していた。

英語が母国語の人でも医療に慣れていないと意味がわからないと感じるのが面白かった。日本語の文章をそれらしい英語に訳すためには、単語や文法の知識だけではなくその英文が使われる背景も知っている必要があるようだ。それには実際に外国で生活してそこで働いたり、学校で勉強したり、英語が母国語の友人を作ったり、大量の英語の本を読んだりしないといけないのだろうけれど億劫だ。

ちなみに、上の質問のベストアンサーは、

it means 6 tablets total per day. there should be a comma so it reads:

2 tablets, 3 times a day

だった。


英文に翻訳してみた。Google 翻訳の訳文を元に手を入れてみたが、どのくらい英文として読めるのかは知る由もない。

I tried to translate Japanese phrase "1kai 2 jou 1 niti 3 kai hukuyou", that means "Take 2 tablets 3 times a day", by Google translation. But the result was "1 tablet 2 tablets 3 times a day".

So, I searched that Japanese phrase by Google search directly, then I found the phrase below on the site "English at pharmacy"

Take two tablets three times a day after every meals.

Although, I was a little bit concerned about whether it is commonly used in the U.S. So, this time, I searched for "Take two tablets three times a day" on Google search and found someone was asking on YAHOO! ANSWERS,

What does '2 tablets 3 times a day mean?'

It was interesting that even native English speakers do not understand the meaning if they are not used to medical treatment. In order to translate Japanese sentences into such good English, it seems necessary to know not only the knowledge of words and grammar but also the background to use that English sentence. To do that, you actually have to live in a foreign country, work there, study in the school, make English friends in their mother tongue, or read a large volume of English books, but those are impossible in my situation.

By the way, the best answer for the above question was,

It means 6 tablets total per day. There should be a comma so it reads:

2 tablets, 3 times a day


[PR]
# by tnomura9 | 2017-01-02 08:08 | 考えるということ | Comments(0)

自分自身を要素として含む集合と含まない集合

ラッセルのパラドックスを引き起こす集合は、「自分自身を要素として含まない集合の集合」だが、「自分自身を要素として含む集合」という集合もイメージしづらい。ところが、これをソシュールの記号論的に解釈すると意外にすっきりと理解できる。

ソシュールは記号をその記号自体である記号表現とその記号が指し示す記号内容が不可分に結びついたものと定義している。そうして、「集合とは物の集まりという物である」という素朴集合論の定義は、記号論的に解釈することができる。すなわち、ものとしての集合は集合の記号表現であり、その集合の外延である物の集まりは集合の記号内容であると定義できる。

こういう風に考えると、記号表現である集合自体がその外延の要素として含まれていることには問題が起きない。また、集合がその外延に含まれていない場合も可能だ。

記号表現である集合自身がその外延に含まれない集合は、再帰的定義にはならないので確定できると思われる。しかし、その場合記号表現としての集合の性質には「自分自身を要素としては含まない」という属性が発生する。そこで、「自分自身を要素として含まない集合」の集合を考えると、記号内容としての外延の要素には自分自身を要素として含まないが、それゆえに記号表現としての集合は「自分自身を要素として含まない集合」という属性を持つことになる。このようなコンフリクトが発生するのは、集合の定義では集合という記号表現とその外延という記号内容が不可分に結びつくためだ。

また、記号表現である集合自身がその外延に含まれるときは、再帰的な定義となるため、その要素である集合自身を確定することができない。つまり、その集合自身は何かという問いには無限再帰のため永遠に答えられない。

こう考えると、素朴集合論にラッセルのパラドックスが発生する原因は、まさに「集合とは物の集まりという物である」という集合の定義に存在していたことが分かる。また、なぜそういうことが起きてしまうのかは、その集合の定義を記号論的に解釈することによって明確にできる。



What is a set which contains itself as an element

The set that causes Russell's paradox is "a set of sets that does not contain itself as an element", but it is hard to imagine a set of "a set containing itself as an element". However, you can clearly understand it from the point of view of Saussure's semiotics.

Saussure defines a symbol as an indivisible combination of the symbolic expression which is the symbol itself and the symbolic content pointed to by the symbol. Then, the definition of the naive set theory that "a set is an object which is a collection of objects" can be interpreted semiotically. That is, a set itself is a symbolic representation of a set, and a collection of objects that are extensions of the set can be defined as the symbolic content of the set.

Considering this kind of situation, the problem does not arise that the set itself, which is a symbolic representation, is included as an element of its extension. It is also possible if the set is not included in the extension.

A set whose symbol expression is not included in its extension is considered to be definable because it does not become a recursive definition. However, in that case, the property of the set as a symbolic representation has an attribute "not including itself as an element". So, considering the set of "sets that do not include themselves as elements", the set itself (symbolic expression) is not included in its extension (symbolic contents), but the set it self (symbolic expression) is also a set that does not include itself. Such a conflict occurs because of the symbolic expression of a set and the signification it i.e. its extension are inseparably linked.

Conversely, when a set itself, which is a symbolic representation, is included in its extension, it is a recursive definition. So it can not determine its own set itself. In other words, the question of what the group itself is unable to answer forever for infinite recursion.

In this way, it turns out that the cause of Russell's paradox occurring in the naive set theory was exactly in the definition of the set "a set is an object which is a collection of objects". Also, why such a thing happens can be clarified by semiotic interpretation of the definition of that set.


[PR]
# by tnomura9 | 2016-12-26 12:45 | ラッセルのパラドックス | Comments(0)

826aska

「スター・ウォーズ」メドレー 【 STAR WARS 】 エレクトーン演奏

パイレーツ・オブ・カリビアン 「彼こそが海賊」 Pirates of the Caribbean エレクトーン

【ルパン三世 '78 2002バージョン】 エレクトーン演奏 Lupin the 3rd '78 2002Version

組曲「となりのトトロ」より エレクトーン演奏

【JIN -仁- Main Title】 エレクトーン演奏

【 Twilight In Upper West 】 エレクトーン演奏

スターウォーズのテーマ 生演奏 天才エレクトーン少女



演奏者は15歳の中学生の女の子。演奏の技術が天才か普通かがネットで議論されているが、聞きたいと思わせる演奏を評価したい。それにかわいいが加わって最強だ。


[PR]
# by tnomura9 | 2016-12-23 15:28 | ボーカロイド | Comments(0)

ラッセルのパラドックスなんて怖くない

集合について初めて学習し始めたとき、そのわかりやすさがうれしかった。

集合を「ものの集まりというもの」としてとらえることで、いろいろなことが分かりやすくなる。和集合や共通部分の意味もよくわかったし、「xは犬である」という術語を満たす x を集めるとそれは集合になるという内包的定義も納得できた。

しかし、参考書を読み進めていくといきなりラッセルのパラドックスが現れて奈落の底に落されたような気持になった。「自分自身を要素として含まない集合の集合」を考えるとパラドックスになってしまうというのだ。素朴集合論はそのため数学の基礎としては全く使えないことになるというのだ。

便利なものをいろいろ見せられたうえで最後にそれは全部不良品でしたと言われたようで、腹立ちを覚えたことを覚えている。

こう言ってもらえたらよかったのだ。「素朴集合論は有限集合を扱っているうちは矛盾はありません。しかし、無限集合を扱うときと、内包的定義を使って集合を定義するなどの集合の概念の拡張を行うときは注意が必要です。」

これらは有限集合の拡張だ。全く問題のなかった有限集合の集合論を無限集合に拡張したり、内包的定義を導入したときにいろいろと不都合なことが起こる可能性がでてくる。無限集合についてはこの記事では触れない。

また、ラッセルのパラドックスは内包公理の問題であって、無限集合との関係はない。それは、床屋のパラドックスや、図書館目録のパラドックスが有限集合について述べているのにも関わらずパラドックスになってしまうことでもわかる。

ラッセルのパラドックスが発生する原因は、集合がものとしての集合それ自体と集合がさし示す「ものの集まり」としての二つの性質が不可分に結びついているという記号論的な構造にある。

ソシュールの記号論では、記号には記号そのものである記号表現とその記号がさし示す記号の概念である記号内容が不可分に結びついているとする。たとえは交通標識のUターン禁止は標識の図柄としてのUターン禁止の画像とそれがさし示すUターンが禁止されているという記号の意味が不可分に結びついている。

「集合とは物の集まりという物である」という集合の定義も、この記号論的な観点から分析することができる。つまり、集合には物としての記号表現とその集合が指し示す物の集まりとしての記号内容が不可分に結びついているのだ。

犬の集合には犬の集合という物としての記号表現と、その集合がさし示す犬の集まりが不可分に結びついている。この場合犬の集合という物も物の一つだから犬の集合の要素として含まれるかどうかを考えないといけない。犬の集合の場合犬の集合自体は犬ではないので自分自身の要素としては含まれない。

ところで、犬の集合や、猫の集合のような自分自身を要素として含まない集合を集めて集合を作ってみよう。たとえば犬の集合と猫の集合の集合である。この犬の集合と猫の集合の集合は自分自身がその要素として含まれるだろうか。犬の集合と猫の集合を集めたものが犬の集合と猫の集合の集合なので、それ自身は自分の要素としては含まれない。

ここで、犬の集合と、猫の集合を考えてみよう。これらはどちらも「自分自身を要素として含まない集合だ」また、犬の集合と猫の集合の集合もやはり、「自分自身を要素としては含まない集合の集合」だ。すなわち、「自分自身を要素として含まない集合」を集めた集合は、それがどのような集合であっても自分自身を要素としては含まないにも関わらず、「自分自身を要素として含まない集合」になってしまう。

したがって、「自分自身を要素として含まない集合」をどのように集めて集合を作ったとしても、その集合の記号内容としての集合は、自分自身を要素として含まないにも関わらず、その集合の記号表現としての集合は「自分自身を要素として含まない」という術語を充足してしまう。言い換えると、「自分自身を要素として含まない集合」を全てあつめた集合をこの述語では定義できないということだ。

端的に言うと、述語として全てのものがそれを充足するかしないかを判定できたとしても、その述語による内包的定義で定義できない集合があるということだ。それは集合に集合そのものとしての記号表現と、その集合が表す記号内容としての物のあつまりが不可分に結びついているという記号論的な性質から説明できる。

説明がわかりにくくなってしまったが、要するに集合は集合という記号表現とその集合で表される物の集まりという記号内容から構成されていると考えることがポイントだ。

この観点でラッセルの集合を見ると、自分自身を要素としては含んでいないがそれゆえに「自分自身を要素として含まない集合」であるというその構造が見えてくる。したがって、ラッセルのパラドックスを得体の知れない奇妙な集合と神秘的に捉える必要はなく、記号表現は、記号内容である物の集まりの一員ではないが、それゆえに記号表現がそれらと同じ述語を充足するという物の集まりの構造が見えてくる。

集合は物の集まりという物であるという集合の定義や「自分自身を要素として含まない集合の集合」というラッセルの集合の定義は単純である。したがってそこから発生するパラドックスのメカニズムも上に述べたように至極単純なものなのだ。

ラッセルの集合の構造が上に述べたような分かりやすい単純な構造であるのが分かれば、ラッセルのパラドックスを説明が不可能な神秘的な現象であると考える必要がなくなる。安心して集合を扱っていいのだ。



[PR]
# by tnomura9 | 2016-12-18 23:49 | ラッセルのパラドックス | Comments(0)