【自然言語処理】Google Colaboratoryでdoc2vecを実装してみよう!

【自然言語処理】Google Colaboratoryでdoc2vecを実装してみよう!

当ページのリンクには広告が含まれています。



本記事では、doc2vecを実装していきます。


doc2vecとはなにか?については、以下の記事でまとめています。

実装の全体像

1. doc2vecを実装する環境を用意する


本記事では、Google Colaboratoryを使用します。


Goofle Colaboratoryとは、ブラウザ上でPythonを記述し実行できる環境です。


Googleのアカウントを持っていいればすぐに利用できます。


GPUも無料で利用できるなど、嬉しい機能がたくさん備わっています。


もし、ローカルの環境に、Google Colaboratoryと似たような開発環境を用意したい場合は、以下の記事を参照いただければと思います。Anaconda Navigatorを用いてjupyter notebookを利用する方法です。


2. Livedoorニュースのファイルをダウンロードしカテゴリ数と内容を確認する


本記事では、Livedoor newsコーパスというテキストコーパスを使用します。



Livedoor newsコーパスファイルをダウンロードし、カテゴリ数と内容を確認する方法は、以下のword2vecを実装する記事にまとめていますので、こちらを参照してください。


3. 類似度計算するドキュメントを抽出


本記事では、Livedoor newsコーパスから、5つほどドキュメントを取り出し、類似度を比較していきます。


まずは、対象となる5つのドキュメントを確認します。


類似度比較する5つのドキュメントを抽出
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
import glob
from janome.tokenizer import Tokenizer
from gensim.models import word2vec

def load_livedoor_news_corpus():
category = {
"dokujo-tsushin": 1,
"it-life-hack":2,
"kaden-channel": 3,
"livedoor-homme": 4,
"movie-enter": 5,
"peachy": 6,
"smax": 7,
"sports-watch": 8,
"topic-news":9
}
docs = []
labels = []

for c_name, c_id in category.items():
files = glob.glob("./data/livedoor/text/{c_name}/{c_name}*.txt".format(c_name=c_name))
for file in files:
with open(file, "r", encoding="utf-8") as f:
lines = f.read().splitlines()
url = lines[0]
datetime = lines[1]
subject = lines[2]
body = "".join(lines[3:])
text = subject + body

docs.append(text)
labels.append(c_id)

return docs, labels

docs, labels = load_livedoor_news_corpus()

print("\nlabel: ", labels[0], "\ndocs:\n", docs[0])
print("\nlabel: ", labels[1], "\ndocs:\n", docs[1])
print("\nlabel: ", labels[2], "\ndocs:\n", docs[2])
print("\nlabel: ", labels[3], "\ndocs:\n", docs[3])
print("\nlabel: ", labels[4], "\ndocs:\n", docs[4])


上記のコードを実行すると以下のような出力が得られるかと思います。


コンソール
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
label:  1 
docs:
東京23区女ひとり風呂 vol.03「台東区・銭湯でアレ発見!」Presented by ゆるっとcafe独女のみなさん、こんにちは。突然ですが、江戸時代の銭湯って、男女混浴だったんですって!老若男女入り乱れ、ここもアソコも洗いあい、奥ではイチャイチャしてる人影。相手もないのにムラムラしちゃったら、垢を掻いてくれる湯女が別室でサービスしてくれて…。砂っぽかった江戸の町は、日に2度3度と銭湯につかることも多かったそうですから、いやはや、想像するだけでワクワクしちゃいますよねぇ!え…私、飢えすぎ? そ、そんなことは……  こんな話をしたワケは、先日訪れた台東区の「燕湯」に、金精様があったからなんです。金精様とは、男性器の形をした神様。子宝の神として各地に祀られているほか、昔はたくさんの女湯に、チン座…いや、鎮座ましましていたそうです。銭湯めぐりを始めてから、いつご対面できるかと心待ちにしていたんですが、どこの銭湯にも、カゲもカタチもなし。これだから近代的理性ってヤボだわと思っていた矢先、ようやく、謁見がかないました。いやー、心願成就! ところでこの金精様、温泉に祀られることも多かったそうです。古来より女陰の象徴とされている温泉に男根を祀ることで、その湯が尽きぬように祈っていたんですね。銭湯もこれにあやかっていると考えて、間違いはなさそう。つまり銭湯は、男女のマグワイの象徴であり、混浴であり、湯女のいる場であり…。まーなんだ、生と性の巨大な隠喩でもあったのではないか、と。 そう考えると、銭湯もただの風呂ではないワケで、今から混浴に戻せというのはムリでも、金精様の存在は、もうちょっと重きを置いてもいいんじゃないかと思うのです。 …いや、女湯に金精様があったら楽しいなって、それだけの話なんですけどね… それはともかく、一緒に燕湯に行った担当編集のN島さんの、臆面もない金精様の撫でっぷりはすごかった。私なんて、口だけだものね。やっぱり子持ちは違うなぁと感じた、独女の小沢でありました。●小沢カオル:独身アラフォー漫画家。ダメ男にひっかかりやすい。現在の恋人は小次郎(柴犬)。主に突撃取材系のマンガを執筆。「あやしい取材に逝ってきました。」「あやしい男と失恋ってきました。」(ともに秋田書店)「あやしい人に遭ってきました。」(ぶんか社)絶賛発売中。

label: 1
docs:
意外と知らない我が家のルーツ! 新年会でご先祖様トークはいかが?新年会などで、祖父母や親戚と顔を合わせる機会が多いお正月。「結婚はまだ?」「そろそろ両親を安心させてあげたら」といった話題にうんざりして、話の流れを変えたくなったとき、意外と役立つのが一族のルーツやご先祖様のお話だ。祖父母や親戚の年長者を話の中心にすることで、新年会の雰囲気も変わるだろう。昨年のお正月、久しぶりに親戚の新年会に出席した美也子さん(38歳・看護士)は、父方の伯父から一族のルーツを初めて聞いた。「伯父によると、大昔、私たちのご先祖様は都でおこった仏教派と国神派の戦いに負けて、武蔵国に追われてきたそうです。負けた側への罰として名前を変えられて、今の名字になったのだとか。後で調べてみたら、飛鳥時代に仏教の礼拝を巡って起こった『丁未の乱』という内乱があったんですよ。これだ! と思いました」武蔵国に来た美也子さんのご先祖様は、やがて広大な土地を手にいれ豊かな暮らしをしていたのだが、長い歴史の中には博打好きの人もいて、土地のほとんどを失ったらしい…。古い家系図もあったが預けていたお寺の火災で焼けてしまい、今となっては詳細なことはわからない…。「正直なところ、どこまで本当なのかわかりませんが、自分の家系が遥か昔から続いていると思うだけでワクワクします」と美也子さんは話してくれた。ここまで歴史をさかのぼる話はそうそう多くはないだろう。しかし、30代の独女なら祖父のそのまた祖父の時代は幕末か明治初頭くらい。小説やドラマでしか知らない時代に、自分のご先祖様や縁のある人が生きていたというだけでも、なんだか嬉しくなってくる。先日、都内で編集の仕事をしている真琴さん(42歳)は、伯母に「仕事で鹿児島へよく行く」と話したところ「あら、ウチのご先祖様にも鹿児島の人がいるのよ」と言われたそうだ。「明治の初めに、埼玉で先祖代々農家を続けている曾祖父の父の元に、薩摩藩の江戸屋敷で生まれ育った女性が嫁いできたそうです。廃藩置県で一度は鹿児島に戻ったものの、言葉もわからず鹿児島の生活にも馴染めなくて、江戸に戻ってきたのだとか。実は、近所に徳川に縁のある神社があるんですよ。もしかしたら篤姫が、その女性の嫁ぎ先として曾祖父の父を選んでくれたのかな? なんて想像しちゃいました」と真琴さんは話してくれた。「食べ物の話題から、曾祖母やその姉妹のことを知った」というのは美鈴さん(30歳・会社員)だ。「子どもの頃にどんなものを食べていたか? という話になったとき、九州の小さな町で育った祖父(90歳)が『子どもの頃から、カレーやシチューを食べていたよ』と言いはじめて…。よくよく話を聞いたら、曾祖母とその姉妹は結婚するまでの間、中国大陸で旅館の仕事を手伝っていて、そこでカレーやシチューの作り方を覚えたということがわかりました」旅館の主なお客様は軍関係者で、味付けは関東風だったとか。「九州の祖父の家で食べるお雑煮は関東風なんです。料理の味付けにも、曾祖母の体験というか人生が関わっているんですね」と美鈴さんは話してくれた。今、自分がここにいるのは両親がいて、祖父母がいて、曾祖父母がいて…。そう思うだけで、たくさんの人に守られているような気がしてくる。親戚が顔を会わせるお正月だからこそ、改めてご先祖様トークをしてみよう。子どもの頃は理解できなかったルーツや、今まで知らなかったご先祖様の武勇伝が飛び出すかもしれない。(オフィスエムツー/神田はるひ)

label: 1
docs:
既婚の女友達にムカッ!とすること片や仕事を辞め、育児に真っ最中の主婦。片やしばらく結婚の予定のない独身のキャリアウーマン。かつてはよき友情関係を育んでいた者同士が、違う立場に置かれて久しく時間が経つと、会話がかみ合わなくなってしまうことがある地方に嫁いだ友人の家族トークにうんざりしたのは好美さん(34歳)。「出張の帰りだったんですが、久しぶりに会いたくなって彼女の家まで足を延ばしたんです。ところが共通の友人のことなど、どんな話題を持ち出しても彼女はほとんどスルー。自分の子どもの話にしか興味を示さないので、どうしていいかわからなくなりました。確かに子どもはかわいいのですが、他人は、他人の子に親以上の興味は持たないもの。もう少し配慮をしてほしかった」赤ちゃんを産んだ元同級生の家に遊びに行った晴美さん(33歳)は、発育相談をもちかけられて返答に困ったという。「友人に『子どもがまだ寝返りができないの』と言われたので『そのうちするんじゃない?』と気楽に答えたら、『親の気持ちがわからない』とムッとした表情で返されました。赤ちゃんが寝返りする時期なんて知らないし、子どもがいないので、正直、心配するママの気持ちもよくわからない。なんて回答すればよかったんでしょうか?」育児熱心なのは幸せの裏返しかもしれないが、トークで置いてきぼりにされてはかなわない。とくに独身女性が既婚女性の間に挟まれると、一歩も二歩もおせっかいを焼きたがる人が出てくる。これには既婚者である自分自身も困惑したと、恵美子さん(37才)。「現在彼氏のいない友人・A子は既女から、しょっちゅう『誰かいい人いないの?』と言われています。しまいには、みんなでなぜA子には彼がいないかという議論に。『もっと残業減らして婚活したら?』などライフスタイルにまでダメ出しをするんですよね。彼女、かつてはお付き合いしている人もいたんですよ。黙って聞いているけど、内心、うんざりしているのでは」結婚後も仕事を続けている恵美子さんは現在、子どもがいない。なかには「早く産め!」と妊娠・出産をせかしてくる知り合いもいるそうだ。「苦労せず、早くに子どもを産んだ人に多いのが『早く子ども産んだほうがいいよ。年取ると大変だよ』という発言。若いころに授からなかったことを今さら言われても、どうしようもありません。いっぺん、『アンタが今から若返らせてくれんの?』と言い返してみたいですね。ああしたセリフをサラッと言える人は鈍感なのかも」女性の体や育児の負担を考えると、妊娠、出産にベターな時期があるのはたしか。発言する側に悪意はないのかもしれないが、無自覚だからこそ相手を苛立たせることもある。「自分も含めて、既婚女性の発言は知らないうちに独身者を傷つけていることもありそう。自戒しようと思いました」と恵美子さん。一方で、既婚の女友達と上手くつき合っていけるケースもある。明美さん(37才)の場合、「『既婚だから』『子持ちだから』ではなく『友達だから』というスタンスで付き合うこと」を心掛けている。「既婚の女友達と遊ぶ時は、なるべく身軽な自分が動くようにします。時間帯も昼間にするなど、こちらも相手の家族を優先する。あと必要以上に相手の家庭のことを詮索したりはしないようにしていますね。自分から気遣うと、相手もあまり自己中心的な話題に走らない気がします。むしろ無神経で扱いづらいのは既婚の男友達。『結婚しろよ』『早く子ども産めば』って、思い出したように突然言うんですよ。嫌気がさして疎遠になった人もいます」よい本や音楽を見つけると、他人にも薦めたくなる。結婚や出産を促すのも、本人らが「よいもの」と感じてるからなのだろう。だけど結婚うんぬんの話題は、下手したら人生に対する口出しにもなりかねないリスキーなもの。丁重に扱わなければならないと、独身、既婚問わず肝に銘じたい。(来布十和)

label: 1
docs:
ひょっとして、あなたは浮気相手かもあなたは、彼氏や意中の人の態度や素行に対して「自分は本命なの?」と疑問を抱いたり、直感的に「何かおかしい…」と思ったことはないだろうか? 一度気になってしまうと、とことん疑いはじめてしまう相手の心。それもそのはず、女性はどんなに小さな出来事も記憶にとどめておき、過去から現在に至るまでの全てをデータベースにおさめる生き物なのだ。“女の勘”の鋭さは霊感並みで、その根底には、このデータベースがあるからと言えるだろう。例えば、歓送迎会など飲み会がかなりの頻度で開催されるこの時期は“女の勘”がフル稼働するのではないだろうか。歓迎会では新しい顔ぶれに妙な新鮮味を覚えてしまったり、送別会で普段は意識しない相手に対して寂寥感を覚えて、つい親密になってしまう、という可能性だって否定はできない。そんな時期だからこそ相手に微妙な変化があると、(急に優しくなったり、あまり目を合わせなくなったり、持ち物・服・食べ物の好みが変わるなど)誰でも不安になるもの。そして女性の多くは、すべてのデータの中から「この納得のいかない違和感は何なのか?」という情報を引き出し、判断の基準にするのだ。恋人がいる方は、そんな不安を抱えずにすむように、相手の気持ちをしっかりと握ることが大切になってくる。しかし、時に“恋は盲目”になるもの。そんな時にこそ気をつけていただきたいのが、自身が浮気・不倫相手になってしまっていないか、ということだ。例えば厚生労働省の「2008年 第4回男女の生活と意識に関する調査(16歳〜49歳の男女1468人を対象)」によれば、既婚男性における「過去1年間に複数のパートナーと性的な関係を持った割合」は35歳未満では4.6%、35歳以上は15.8%にのぼったという。つまり、10人に一人以上の割合で男性は浮気・不倫をしている人がいるということだ。特に最近の若年層の男性におけるセックス離れを考えると、年齢が高くなるにつれて、女性関係が派手な男性が増加しているのではないだろうか。運悪く不倫相手となってしまった場合、男性のパートナー(相手の奥さん)から訴訟を起こされ、損害賠償を請求されることも無い話ではない。ちなみにその慰謝料は心の損害であることから、ケースバイケースになるが、おおよそ50万円から300万円という場合が多いという。独女の方々の中には真剣に生涯のパートナーを探している方も多いだろう。だからこそ、そんな心の隙間に入り込んでくる男性の本性を見破ることはとても難しい。最近では特に結婚していなくても、相手に浮気や不倫のそぶりがあれば、探偵会社に浮気調査を依頼する女性も多いという。1日だけの調査も引き受けてくれるし、クレジットカード払いも可能になるなど意外と身近になってきたのではないだろうか。確かに、万が一にも自分が不倫相手などになってしまった時のリスクを考えれば、こういった調査のプロに依頼してしまうのも一つの賢い選択なのかもしれない。もちろん、そういった行為自体は一時的に相手を疑うことになってしまう。しかし、”シロ”と分かれば、よりいっそうパートナーを信頼する裏付けとなることは間違いないはずだ。■関連リンク探偵会社の詳細はこちら

label: 1
docs:
髪以外に白髪発見! あなたはどこに?初めて髪に「白い1本」を見つけたのは20代後半のとき、という優香さん(40歳・コピーライター)。「徹夜もよくしていたし、当時の職場ではいろいろストレスを感じていたので、そのせいかと思ってましたが……」。30代前半で退職しフリーになり、ストレスもなくなったのに白髪はその後も増える一方。白髪染めは欠かせなくなって久しい。年齢的なものかとあきらめてはいるが、友人たちと集まったとき、ついぼやいてしまった。ところが、居合わせた友人からは意外な告白があったという。頭髪の白髪は数本、という智子さん(38歳・デザイナー)は、「髪も気になるけどね、実は……」と切り出した。「鼻の下の産毛が気になっていたから脱毛に通っているのだけど、経過はどうかと鏡を見ていたら、なんと1本、白髪があったのよ〜!」。施術は、黒い毛根にダメージを与える光脱毛というものなので、「白髪だと毛根も白いだろうから、ここだけは脱毛されなさそう……」と残念そうだったという。里美さん(35歳・編集者)は、「私だけじゃなかったんですね! 私の場合はまゆ毛! しかもなぜか左だけ。数えたら4本もあってびっくり。髪の毛よりまゆ毛が先に白くなるなんて……」と苦笑。髪は黒々としていて染めてもいない陽子さん(41歳・整体師)も「私はアンダーヘアに1本」と、続々カミングアウト。海外ドラマ『SEX AND THE CITY』ファンの優香さんがそれを聞いて思い出したのは、仲間の最年長のサマンサがアンダーヘアに白髪を見つけショックを受けたエピソード。ドラマでは染めて失敗していたが……。それでみんなはどう対処したのかと聞いてみた。脱毛中の智子さんは、「抜くのは肌によくないとサロンで言われたし、脱毛効果も薄れるので、剃っている」。あとの2人は抜いたという。ちなみに抜いても、またそこから白髪が生えてくるので、抜くのはその場しのぎにしかならない。優香さんはみんなの話を聞いて、「白髪の量でいえば私が一番ですが、頭髪は染めるのが手軽。みんなよりケアは楽な方かも」と思ったという。とはいえ、次にどこに白髪が発見されるかは未知数で、人ごとではない。「男性だったらヒゲに白いものが混じっていても大人の魅力とも取れますが、女はねえ……。数本のうちはまだ笑い飛ばせるけど、これ以上増やさないにはどうしたらいいんだろうって、そのあとずいぶん話が盛り上がりましたよ」。黒々とした髪の陽子さんが「私はよく食べてるけど、黒い食べ物がいいらしいよ。海藻類や黒ごまとか」と言うのが妙に説得力があったそうだ。そのほか、牡蛎やシジミに含まれる亜鉛やカルシウムなどのミネラルもいいという。白髪の原因にはまだ謎が多く、加齢のほか遺伝、ストレス、紫外線によるDNAの損傷など諸説あるが、血流不足も一因といわれている。優香さんは何度かヘッドマッサージを受けたとき、頭が凝っていると言われたことがある。「頭ならマッサージしやすいから自分でもやろう、と思いつつ、なかなか……。でも、これからは心を改めます」と、髪にいいというセサミオイルを購入し、ヘッドマッサージを始めた。まゆ毛に白髪の里美さんも、「まゆ毛周囲はツボもあって押すと気持ちいいし、目の疲れにもいいから、指圧を心掛けるようになりました」。その後の改善につながるかはまだなんともいえないが、体のためにはプラスであるはずだ。自分とはまだまだ関係のない話、と思っているあなたも、ひょっとしたら明日は我が身!? 偏食や不規則でストレスフルな生活を送っていると、白髪を増やすかも? 髪もムダ毛も体の一部。白髪になってからではなく、普段からいたわっていきましょう。(オフィスエムツー/オオノマキ)

4.抽出したドキュメントを分かち書き処理


続いて、抽出した5つのドキュメントを分かち書きし、リストに格納します。


抽出した5つのドキュメントを分かち書きしてリストに格納
1
2
3
4
token = []
t = Tokenizer()
for i in range(6):
token.append(t.tokenize(docs[i], wakati=True,))


list(token[0])を実施すると以下のような出力が得られ、分かち書きができていることが確認できます。


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
['東京',
'23',
'区',
'女',
'ひとり',
'風呂',
' ',
'vol',
'.',
'03',
'「',
'台東',
'区',
'・',
'銭湯',
'で',
'アレ',


(省略)


')',
'「',
'あやしい',
'人',
'に',
'遭っ',
'て',
'き',
'まし',
'た',
'。',
'」',
'(',
'ぶんか社',
')',
'絶賛',
'発売',
'中',
'。']
[24]
153426

5. Doc2Vecの実装


doc2vecを用いて学習を行い、モデルを作成します。


まずは学習用のデータを整備します。


1
2
3
4
5
6
from gensim.models.doc2vec import Doc2Vec
from gensim.models.doc2vec import TaggedDocument

training_docs = []
for i in range(6):
training_docs.append(TaggedDocument(words=list(token[i]), tags=["d" + str(i)]))


上記のコードの説明をします。


Doc2Vecの実装には、gensimというモジュールを使用します。


また、学習用のデータを用意するために、TaggedDocumentを使用します。


training_docsという空のリストを作成します。


TaggedDocumentの引数にwords="分かち書きされた各要素", tags=["タグ"]を与えることで、TaggedDocumentクラスのインスタンスを作成することができます。


training_docsというコードを実行すると、以下のような出力が確認できると思います。


出力
1
2
3
4
5
6
[TaggedDocument(words=['東京', '23', '区', '女', 'ひとり', '風呂', ' ', 'vol', '.', '03', '「', '台東', '区', '・', '銭湯', 'で', 'アレ', '発見', '!', '」', 'Presented', ' ', 'by', ' ', 'ゆる', 'っと', 'cafe', '独', '女', 'の', 'みなさん', '、', 'こんにちは', '。', '突然', 'です', 'が', '、', '江戸', '時代', 'の', '銭湯', 'って', '、', '男女', '混浴', 'だっ', 'た', 'ん', 'です', 'って', '!', '老若男女', '入り乱れ', '、', 'ここ', 'も', 'アソコ', 'も', '洗い', 'あい', '、', '奥', 'で', 'は', 'イチャイチャ', 'し', 'てる', '人影', '。', '相手', 'も', 'ない', 'のに', 'ムラムラ', 'し', 'ちゃっ', 'たら', '、', '垢', 'を', '掻い', 'て', 'くれる', '湯女', 'が', '別室', 'で', 'サービス', 'し', 'て', 'くれ', 'て', '…', '。', '砂', 'っぽかっ', 'た', '江戸', 'の', '町', 'は', '、', '日', 'に', '2', '度', '3', '度', 'と', '銭湯', 'に', 'つかる', 'こと', 'も', '多かっ', 'た', 'そう', 'です', 'から', '、', 'いや', 'はや', '、', '想像', 'する', 'だけ', 'で', 'ワクワク', 'し', 'ちゃい', 'ます', 'よ', 'ねぇ', '!', 'え', '…', '私', '、', '飢え', 'すぎ', '?', '\u3000', 'そ', '、', 'そんな', 'こと', 'は', '…', '…', '\u3000', '\u3000', 'こんな', '話', 'を', 'し', 'た', 'ワケ', 'は', '、', '先日', '訪れ', 'た', '台東', '区', 'の', '「', '燕', '湯', '」', 'に', '、', '金', '精', '様', 'が', 'あっ', 'た', 'から', 'なん', 'です', '。', '金', '精', '様', 'と', 'は', '、', '男性', '器', 'の', '形', 'を', 'し', 'た', '神様', '。', '子宝', 'の', '神', 'として', '各地', 'に', '祀ら', 'れ', 'て', 'いる', 'ほか', '、', '昔', 'は', 'たくさん', 'の', '女', '湯', 'に', '、', 'チン', '座', '…', 'いや', '、', '鎮座', 'まし', 'まし', 'て', 'い', 'た', 'そう', 'です', '。', '銭湯', 'めぐり', 'を', '始め', 'て', 'から', '、', 'い', 'つ', 'ご', '対面', 'できる', 'か', 'と', '心待ち', 'に', 'し', 'て', 'い', 'た', 'ん', 'です', 'が', '、', 'どこ', 'の', '銭湯', 'に', 'も', '、', 'カゲ', 'も', 'カタチ', 'も', 'なし', '。', 'これ', 'だ', 'から', '近代', '的', '理性', 'って', 'ヤボ', 'だ', 'わ', 'と', '思っ', 'て', 'い', 'た', '矢先', '、', 'ようやく', '、', '謁見', 'が', 'かない', 'まし', 'た', '。', 'いやー', '、', '心願', '成就', '!', '\u3000', 'ところで', 'この', '金', '精', '様', '、', '温泉', 'に', '祀ら', 'れる', 'こと', 'も', '多かっ', 'た', 'そう', 'です', '。', '古来', 'より', '女', '陰', 'の', '象徴', 'と', 'さ', 'れ', 'て', 'いる', '温泉', 'に', '男根', 'を', '祀る', 'こと', 'で', '、', 'その', '湯', 'が', '尽き', 'ぬ', 'よう', 'に', '祈っ', 'て', 'い', 'た', 'ん', 'です', 'ね', '。', '銭湯', 'も', 'これ', 'に', 'あやかっ', 'て', 'いる', 'と', '考え', 'て', '、', '間違い', 'は', 'な', 'さ', 'そう', '。', 'つまり', '銭湯', 'は', '、', '男女', 'の', 'マグワイ', 'の', '象徴', 'で', 'あり', '、', '混浴', 'で', 'あり', '、', '湯女', 'の', 'いる', '場', 'で', 'あり', '…', '。', 'ま', 'ー', 'な', 'ん', 'だ', '、', '生', 'と', '性', 'の', '巨大', 'な', '隠喩', 'でも', 'あっ', 'た', 'の', 'で', 'は', 'ない', 'か', '、', 'と', '。', '\u3000', 'そう', '考える', 'と', '、', '銭湯', 'も', 'ただ', 'の', '風呂', 'で', 'は', 'ない', 'ワケ', 'で', '、', '今', 'から', '混浴', 'に', '戻せ', 'と', 'いう', 'の', 'は', 'ムリ', 'でも', '、', '金', '精', '様', 'の', '存在', 'は', '、', 'もう', 'ちょっと', '重き', 'を', '置い', 'て', 'も', 'いい', 'ん', 'じゃ', 'ない', 'か', 'と', '思う', 'の', 'です', '。', '\u3000', '…', 'いや', '、', '女', '湯', 'に', '金', '精', '様', 'が', 'あっ', 'たら', '楽しい', 'なっ', 'て', '、', 'それだけ', 'の', '話', 'な', 'ん', 'です', 'けど', 'ね', '…', '\u3000', 'それ', 'は', 'ともかく', '、', '一緒', 'に', '燕', '湯', 'に', '行っ', 'た', '担当', '編集', 'の', 'N', '島', 'さん', 'の', '、', '臆面', 'も', 'ない', '金', '精', '様', 'の', '撫で', 'っぷり', 'は', 'すごかっ', 'た', '。', '私', 'なんて', '、', '口', 'だけ', 'だ', 'もの', 'ね', '。', 'やっぱり', '子持ち', 'は', '違う', 'なぁ', 'と', '感じ', 'た', '、', '独', '女', 'の', '小沢', 'で', 'あり', 'まし', 'た', '。', '●', '小沢', 'カオル', ':', '独身', 'アラフォー', '漫画', '家', '。', 'ダメ', '男', 'に', 'ひっかかり', 'やすい', '。', '現在', 'の', '恋人', 'は', '小次郎', '(', '柴犬', ')', '。', '主', 'に', '突撃', '取材', '系', 'の', 'マンガ', 'を', '執筆', '。', '「', 'あやしい', '取材', 'に', '逝っ', 'て', 'き', 'まし', 'た', '。', '」', '「', 'あやしい', '男', 'と', '失恋', 'って', 'き', 'まし', 'た', '。', '」', '(', 'ともに', '秋田', '書店', ')', '「', 'あやしい', '人', 'に', '遭っ', 'て', 'き', 'まし', 'た', '。', '」', '(', 'ぶんか社', ')', '絶賛', '発売', '中', '。'], tags=['d0']),
TaggedDocument(words=['意外と', '知ら', 'ない', '我が家', 'の', 'ルーツ', '!', ' ', '新年', '会', 'で', 'ご', '先祖', '様', 'トーク', 'は', 'いかが', '?', '新年', '会', 'など', 'で', '、', '祖父母', 'や', '親戚', 'と', '顔', 'を', '合わせる', '機会', 'が', '多い', 'お正月', '。', '「', '結婚', 'は', 'まだ', '?', '」', '「', 'そろそろ', '両親', 'を', '安心', 'さ', 'せ', 'て', 'あげ', 'たら', '」', 'といった', '話題', 'に', 'うんざり', 'し', 'て', '、', '話', 'の', '流れ', 'を', '変え', 'たく', 'なっ', 'た', 'とき', '、', '意外と', '役立つ', 'の', 'が', '一族', 'の', 'ルーツ', 'や', 'ご', '先祖', '様', 'の', 'お話', 'だ', '。', '祖父母', 'や', '親戚', 'の', '年長', '者', 'を', '話', 'の', '中心', 'に', 'する', 'こと', 'で', '、', '新年', '会', 'の', '雰囲気', 'も', '変わる', 'だろ', 'う', '。', '昨年', 'の', 'お正月', '、', '久しぶり', 'に', '親戚', 'の', '新年', '会', 'に', '出席', 'し', 'た', '美也子', 'さん', '(', '38', '歳', '・', '看護', '士', ')', 'は', '、', '父方', 'の', '伯父', 'から', '一族', 'の', 'ルーツ', 'を', '初めて', '聞い', 'た', '。', '「', '伯父', 'に', 'よる', 'と', '、', '大昔', '、', '私', 'たち', 'の', 'ご', '先祖', '様', 'は', '都', 'で', 'おこっ', 'た', '仏教', '派', 'と', '国神', '派', 'の', '戦い', 'に', '負け', 'て', '、', '武蔵', '国', 'に', '追わ', 'れ', 'て', 'き', 'た', 'そう', 'です', '。', '負け', 'た', '側', 'へ', 'の', '罰', 'として', '名前', 'を', '変え', 'られ', 'て', '、', '今', 'の', '名字', 'に', 'なっ', 'た', 'の', 'だ', 'と', 'か', '。', '後で', '調べ', 'て', 'み', 'たら', '、', '飛鳥', '時代', 'に', '仏教', 'の', '礼拝', 'を', '巡っ', 'て', '起こっ', 'た', '『', '丁未', 'の', '乱', '』', 'という', '内乱', 'が', 'あっ', 'た', 'ん', 'です', 'よ', '。', 'これ', 'だ', '!', ' ', 'と', '思い', 'まし', 'た', '」', '武蔵', '国', 'に', '来', 'た', '美也子', 'さん', 'の', 'ご', '先祖', '様', 'は', '、', 'やがて', '広大', 'な', '土地', 'を', '手', 'に', 'いれ', '豊か', 'な', '暮らし', 'を', 'し', 'て', 'い', 'た', 'の', 'だ', 'が', '、', '長い', '歴史', 'の', '中', 'に', 'は', '博打', '好き', 'の', '人', 'も', 'い', 'て', '、', '土地', 'の', 'ほとんど', 'を', '失っ', 'た', 'らしい', '…', '。', '古い', '家系', '図', 'も', 'あっ', 'た', 'が', '預け', 'て', 'い', 'た', 'お寺', 'の', '火災', 'で', '焼け', 'て', 'しまい', '、', '今', 'と', 'なっ', 'て', 'は', '詳細', 'な', 'こと', 'は', 'わから', 'ない', '…', '。', '「', '正直', 'な', 'ところ', '、', 'どこ', 'まで', '本当', 'な', 'の', 'か', 'わかり', 'ませ', 'ん', 'が', '、', '自分', 'の', '家系', 'が', '遥か', '昔', 'から', '続い', 'て', 'いる', 'と', '思う', 'だけ', 'で', 'ワクワク', 'し', 'ます', '」', 'と', '美也子', 'さん', 'は', '話し', 'て', 'くれ', 'た', '。', 'ここ', 'まで', '歴史', 'を', 'さかのぼる', '話', 'は', 'そう', 'そう', '多く', 'は', 'ない', 'だろ', 'う', '。', 'しかし', '、', '30', '代', 'の', '独', '女', 'なら', '祖父', 'の', 'その', 'また', '祖父', 'の', '時代', 'は', '幕末', 'か', '明治', '初頭', 'くらい', '。', '小説', 'や', 'ドラマ', 'で', 'しか', '知ら', 'ない', '時代', 'に', '、', '自分', 'の', 'ご', '先祖', '様', 'や', '縁', 'の', 'ある', '人', 'が', '生き', 'て', 'い', 'た', 'と', 'いう', 'だけ', 'でも', '、', 'なんだか', '嬉しく', 'なっ', 'て', 'くる', '。', '先日', '、', '都内', 'で', '編集', 'の', '仕事', 'を', 'し', 'て', 'いる', '真琴', 'さん', '(', '42', '歳', ')', 'は', '、', '伯母', 'に', '「', '仕事', 'で', '鹿児島', 'へ', 'よく', '行く', '」', 'と', '話し', 'た', 'ところ', '「', 'あら', '、', 'ウチ', 'の', 'ご', '先祖', '様', 'に', 'も', '鹿児島', 'の', '人', 'が', 'いる', 'の', 'よ', '」', 'と', '言わ', 'れ', 'た', 'そう', 'だ', '。', '「', '明治', 'の', '初め', 'に', '、', '埼玉', 'で', '先祖', '代', '々', '農家', 'を', '続け', 'て', 'いる', '曾祖父', 'の', '父', 'の', '元', 'に', '、', '薩摩', '藩', 'の', '江戸', '屋敷', 'で', '生まれ', '育っ', 'た', '女性', 'が', '嫁い', 'で', 'き', 'た', 'そう', 'です', '。', '廃藩置県', 'で', '一', '度', 'は', '鹿児島', 'に', '戻っ', 'た', 'ものの', '、', '言葉', 'も', 'わから', 'ず', '鹿児島', 'の', '生活', 'に', 'も', '馴染め', 'なく', 'て', '、', '江戸', 'に', '戻っ', 'て', 'き', 'た', 'の', 'だ', 'と', 'か', '。', '実は', '、', '近所', 'に', '徳川', 'に', '縁', 'の', 'ある', '神社', 'が', 'ある', 'ん', 'です', 'よ', '。', 'もしか', 'し', 'たら', '篤', '姫', 'が', '、', 'その', '女性', 'の', '嫁ぎ', '先', 'として', '曾祖父', 'の', '父', 'を', '選ん', 'で', 'くれ', 'た', 'の', 'か', 'な', '?', ' ', 'なんて', '想像', 'し', 'ちゃい', 'まし', 'た', '」', 'と', '真琴', 'さん', 'は', '話し', 'て', 'くれ', 'た', '。', '「', '食べ物', 'の', '話題', 'から', '、', '曾祖母', 'や', 'その', '姉妹', 'の', 'こと', 'を', '知っ', 'た', '」', 'という', 'の', 'は', '美鈴', 'さん', '(', '30', '歳', '・', '会社', '員', ')', 'だ', '。', '「', '子ども', 'の', '頃', 'に', 'どんな', 'もの', 'を', '食べ', 'て', 'い', 'た', 'か', '?', ' ', 'という', '話', 'に', 'なっ', 'た', 'とき', '、', '九州', 'の', '小さな', '町', 'で', '育っ', 'た', '祖父', '(', '90', '歳', ')', 'が', '『', '子ども', 'の', '頃', 'から', '、', 'カレー', 'や', 'シチュー', 'を', '食べ', 'て', 'い', 'た', 'よ', '』', 'と', '言い', 'はじめ', 'て', '…', '。', 'よく', 'よく', '話', 'を', '聞い', 'たら', '、', '曾祖母', 'と', 'その', '姉妹', 'は', '結婚', 'する', 'まで', 'の', '間', '、', '中国', '大陸', 'で', '旅館', 'の', '仕事', 'を', '手伝っ', 'て', 'い', 'て', '、', 'そこで', 'カレー', 'や', 'シチュー', 'の', '作り方', 'を', '覚え', 'た', 'という', 'こと', 'が', 'わかり', 'まし', 'た', '」', '旅館', 'の', '主', 'な', 'お客様', 'は', '軍', '関係', '者', 'で', '、', '味付け', 'は', '関東', '風', 'だっ', 'た', 'と', 'か', '。', '「', '九州', 'の', '祖父', 'の', '家', 'で', '食べる', 'お', '雑煮', 'は', '関東', '風', 'な', 'ん', 'です', '。', '料理', 'の', '味付け', 'に', 'も', '、', '曾祖母', 'の', '体験', 'という', 'か', '人生', 'が', '関わっ', 'て', 'いる', 'ん', 'です', 'ね', '」', 'と', '美鈴', 'さん', 'は', '話し', 'て', 'くれ', 'た', '。', '今', '、', '自分', 'が', 'ここ', 'に', 'いる', 'の', 'は', '両親', 'が', 'い', 'て', '、', '祖父母', 'が', 'い', 'て', '、', '曾祖', '父母', 'が', 'い', 'て', '…', '。', 'そう', '思う', 'だけ', 'で', '、', 'たくさん', 'の', '人', 'に', '守ら', 'れ', 'て', 'いる', 'よう', 'な', '気', 'が', 'し', 'て', 'くる', '。', '親戚', 'が', '顔', 'を', '会わ', 'せる', 'お正月', 'だ', 'から', 'こそ', '、', '改めて', 'ご', '先祖', '様', 'トーク', 'を', 'し', 'て', 'みよ', 'う', '。', '子ども', 'の', '頃', 'は', '理解', 'でき', 'なかっ', 'た', 'ルーツ', 'や', '、', '今', 'まで', '知ら', 'なかっ', 'た', 'ご', '先祖', '様', 'の', '武勇', '伝', 'が', '飛び出す', 'かも', 'しれ', 'ない', '。', '(', 'オフィスエムツー', '/', '神田', 'はる', 'ひ', ')'], tags=['d1']),
TaggedDocument(words=['既婚', 'の', '女', '友達', 'に', 'ムカッ', '!', 'と', 'する', 'こと', '片や', '仕事', 'を', '辞め', '、', '育児', 'に', '真っ最中', 'の', '主婦', '。', '片や', 'しばらく', '結婚', 'の', '予定', 'の', 'ない', '独身', 'の', 'キャリアウーマン', '。', 'かつて', 'は', 'よき', '友情', '関係', 'を', '育ん', 'で', 'い', 'た', '者', '同士', 'が', '、', '違う', '立場', 'に', '置か', 'れ', 'て', '久しく', '時間', 'が', '経つ', 'と', '、', '会話', 'が', 'かみ合わ', 'なく', 'なっ', 'て', 'しまう', 'こと', 'が', 'ある', '地方', 'に', '嫁い', 'だ', '友人', 'の', '家族', 'トーク', 'に', 'うんざり', 'し', 'た', 'の', 'は', '好美', 'さん', '(', '34', '歳', ')', '。', '「', '出張', 'の', '帰り', 'だっ', 'た', 'ん', 'です', 'が', '、', '久しぶり', 'に', '会い', 'たく', 'なっ', 'て', '彼女', 'の', '家', 'まで', '足', 'を', '延ばし', 'た', 'ん', 'です', '。', 'ところが', '共通', 'の', '友人', 'の', 'こと', 'など', '、', 'どんな', '話題', 'を', '持ち出し', 'て', 'も', '彼女', 'は', 'ほとんど', 'スルー', '。', '自分', 'の', '子ども', 'の', '話', 'に', 'しか', '興味', 'を', '示さ', 'ない', 'ので', '、', 'どうして', 'いい', 'か', 'わから', 'なく', 'なり', 'まし', 'た', '。', '確か', 'に', '子ども', 'は', 'かわいい', 'の', 'です', 'が', '、', '他人', 'は', '、', '他人', 'の', '子', 'に', '親', '以上', 'の', '興味', 'は', '持た', 'ない', 'もの', '。', 'もう少し', '配慮', 'を', 'し', 'て', 'ほしかっ', 'た', '」', '赤ちゃん', 'を', '産ん', 'だ', '元', '同級生', 'の', '家', 'に', '遊び', 'に', '行っ', 'た', '晴美', 'さん', '(', '33', '歳', ')', 'は', '、', '発育', '相談', 'を', 'もちかけ', 'られ', 'て', '返答', 'に', '困っ', 'た', 'と', 'いう', '。', '「', '友人', 'に', '『', '子ども', 'が', 'まだ', '寝返り', 'が', 'でき', 'ない', 'の', '』', 'と', '言わ', 'れ', 'た', 'ので', '『', 'そのうち', 'する', 'ん', 'じゃ', 'ない', '?', '』', 'と', '気楽', 'に', '答え', 'たら', '、', '『', '親', 'の', '気持ち', 'が', 'わから', 'ない', '』', 'と', 'ムッ', 'と', 'し', 'た', '表情', 'で', '返さ', 'れ', 'まし', 'た', '。', '赤ちゃん', 'が', '寝返り', 'する', '時期', 'なんて', '知ら', 'ない', 'し', '、', '子ども', 'が', 'い', 'ない', 'ので', '、', '正直', '、', '心配', 'する', 'ママ', 'の', '気持ち', 'も', 'よく', 'わから', 'ない', '。', 'なんて', '回答', 'すれ', 'ば', 'よかっ', 'た', 'ん', 'でしょ', 'う', 'か', '?', '」', '育児', '熱心', 'な', 'の', 'は', '幸せ', 'の', '裏返し', 'かも', 'しれ', 'ない', 'が', '、', 'トーク', 'で', '置いてきぼり', 'に', 'さ', 'れ', 'て', 'は', 'かなわ', 'ない', '。', 'とくに', '独身', '女性', 'が', '既婚', '女性', 'の', '間', 'に', '挟ま', 'れる', 'と', '、', '一', '歩', 'も', '二', '歩', 'も', 'おせっかい', 'を', '焼き', 'た', 'がる', '人', 'が', '出', 'て', 'くる', '。', 'これ', 'に', 'は', '既婚', '者', 'で', 'ある', '自分', '自身', 'も', '困惑', 'し', 'た', 'と', '、', '恵美子', 'さん', '(', '37', '才', ')', '。', '「', '現在', '彼氏', 'の', 'い', 'ない', '友人', '・', 'A', '子', 'は', '既', '女', 'から', '、', 'しょっちゅう', '『', '誰', 'か', 'いい', '人', 'い', 'ない', 'の', '?', '』', 'と', '言わ', 'れ', 'て', 'い', 'ます', '。', 'しまいに', 'は', '、', 'みんな', 'で', 'なぜ', 'A子', 'に', 'は', '彼', 'が', 'い', 'ない', 'か', 'という', '議論', 'に', '。', '『', 'もっと', '残業', '減らし', 'て', '婚', '活', 'し', 'たら', '?', '』', 'など', 'ライフスタイル', 'に', 'まで', 'ダメ', '出し', 'を', 'する', 'ん', 'です', 'よ', 'ね', '。', '彼女', '、', 'かつて', 'は', 'お', '付き合い', 'し', 'て', 'いる', '人', 'も', 'い', 'た', 'ん', 'です', 'よ', '。', '黙っ', 'て', '聞い', 'て', 'いる', 'けど', '、', '内心', '、', 'うんざり', 'し', 'て', 'いる', 'の', 'で', 'は', '」', '結婚', '後', 'も', '仕事', 'を', '続け', 'て', 'いる', '恵美子', 'さん', 'は', '現在', '、', '子ども', 'が', 'い', 'ない', '。', 'なか', 'に', 'は', '「', '早く', '産め', '!', '」', 'と', '妊娠', '・', '出産', 'を', 'せかし', 'て', 'くる', '知り合い', 'も', 'いる', 'そう', 'だ', '。', '「', '苦労', 'せ', 'ず', '、', '早く', 'に', '子ども', 'を', '産ん', 'だ', '人', 'に', '多い', 'の', 'が', '『', '早く', '子ども', '産ん', 'だ', 'ほう', 'が', 'いい', 'よ', '。', '年取る', 'と', '大変', 'だ', 'よ', '』', 'という', '発言', '。', '若い', 'ころ', 'に', '授から', 'なかっ', 'た', 'こと', 'を', '今さら', '言わ', 'れ', 'て', 'も', '、', 'どう', 'しよう', 'も', 'あり', 'ませ', 'ん', '。', 'いっぺん', '、', '『', 'アンタ', 'が', '今', 'から', '若返ら', 'せ', 'て', 'くれ', 'ん', 'の', '?', '』', 'と', '言い返し', 'て', 'みたい', 'です', 'ね', '。', 'ああ', 'し', 'た', 'セリフ', 'を', 'サラッ', 'と', '言える', '人', 'は', '鈍感', 'な', 'の', 'かも', '」', '女性', 'の', '体', 'や', '育児', 'の', '負担', 'を', '考える', 'と', '、', '妊娠', '、', '出産', 'に', 'ベター', 'な', '時期', 'が', 'ある', 'の', 'は', 'たしか', '。', '発言', 'する', '側', 'に', '悪意', 'は', 'ない', 'の', 'かも', 'しれ', 'ない', 'が', '、', '無自覚', 'だ', 'から', 'こそ', '相手', 'を', '苛立た', 'せる', 'こと', 'も', 'ある', '。', '「', '自分', 'も', '含め', 'て', '、', '既婚', '女性', 'の', '発言', 'は', '知ら', 'ない', 'うち', 'に', '独身', '者', 'を', '傷つけ', 'て', 'いる', 'こと', 'も', 'あり', 'そう', '。', '自戒', 'しよ', 'う', 'と', '思い', 'まし', 'た', '」', 'と', '恵美子', 'さん', '。', '一方', 'で', '、', '既婚', 'の', '女', '友達', 'と', '上手く', 'つき合っ', 'て', 'いける', 'ケース', 'も', 'ある', '。', '明美', 'さん', '(', '37', '才', ')', 'の', '場合', '、', '「', '『', '既婚', 'だ', 'から', '』', '『', '子持ち', 'だ', 'から', '』', 'で', 'は', 'なく', '『', '友達', 'だ', 'から', '』', 'という', 'スタンス', 'で', '付き合う', 'こと', '」', 'を', '心掛け', 'て', 'いる', '。', '「', '既婚', 'の', '女', '友達', 'と', '遊ぶ', '時', 'は', '、', 'なるべく', '身軽', 'な', '自分', 'が', '動く', 'よう', 'に', 'し', 'ます', '。', '時間', '帯', 'も', '昼間', 'に', 'する', 'など', '、', 'こちら', 'も', '相手', 'の', '家族', 'を', '優先', 'する', '。', 'あと', '必要', '以上', 'に', '相手', 'の', '家庭', 'の', 'こと', 'を', '詮索', 'し', 'たり', 'は', 'し', 'ない', 'よう', 'に', 'し', 'て', 'い', 'ます', 'ね', '。', '自分', 'から', '気遣う', 'と', '、', '相手', 'も', 'あまり', '自己', '中心', '的', 'な', '話題', 'に', '走ら', 'ない', '気', 'が', 'し', 'ます', '。', 'むしろ', '無', '神経', 'で', '扱い', 'づらい', 'の', 'は', '既婚', 'の', '男', '友達', '。', '『', '結婚', 'しろ', 'よ', '』', '『', '早く', '子ども', '産め', 'ば', '』', 'って', '、', '思い出し', 'た', 'よう', 'に', '突然', '言う', 'ん', 'です', 'よ', '。', '嫌気', 'が', 'さして', '疎遠', 'に', 'なっ', 'た', '人', 'も', 'い', 'ます', '」', 'よい', '本', 'や', '音楽', 'を', '見つける', 'と', '、', '他人', 'に', 'も', '薦め', 'たく', 'なる', '。', '結婚', 'や', '出産', 'を', '促す', 'の', 'も', '、', '本人', 'ら', 'が', '「', 'よい', 'もの', '」', 'と', '感じ', 'てる', 'から', 'な', 'の', 'だろ', 'う', '。', 'だけど', '結婚', 'うんぬん', 'の', '話題', 'は', '、', '下手', 'し', 'たら', '人生', 'に対する', '口出し', 'に', 'も', 'なり', 'かね', 'ない', 'リスキー', 'な', 'もの', '。', '丁重', 'に', '扱わ', 'なけれ', 'ば', 'なら', 'ない', 'と', '、', '独身', '、', '既婚', '問わ', 'ず', '肝', 'に', '銘じ', 'たい', '。', '(', '来', '布', '十', '和', ')'], tags=['d2']),
TaggedDocument(words=['ひょっと', 'し', 'て', '、', 'あなた', 'は', '浮気', '相手', 'かも', 'あなた', 'は', '、', '彼氏', 'や', '意中', 'の', '人', 'の', '態度', 'や', '素行', 'に対して', '「', '自分', 'は', '本命', 'な', 'の', '?', '」', 'と', '疑問', 'を', '抱い', 'たり', '、', '直感', '的', 'に', '「', '何', 'か', 'おかしい', '…', '」', 'と', '思っ', 'た', 'こと', 'は', 'ない', 'だろ', 'う', 'か', '?', '\u3000', '一度', '気', 'に', 'なっ', 'て', 'しまう', 'と', '、', 'とことん', '疑い', 'はじめ', 'て', 'しまう', '相手', 'の', '心', '。', 'それ', 'も', 'その', 'はず', '、', '女性', 'は', 'どんなに', '小さな', '出来事', 'も', '記憶', 'に', 'とどめ', 'て', 'おき', '、', '過去', 'から', '現在', 'に', '至る', 'まで', 'の', '全て', 'を', 'データベース', 'に', 'おさめる', '生き物', 'な', 'の', 'だ', '。', '“', '女', 'の', '勘', '”', 'の', '鋭さ', 'は', '霊感', '並み', 'で', '、', 'その', '根底', 'に', 'は', '、', 'この', 'データベース', 'が', 'ある', 'から', 'と', '言える', 'だろ', 'う', '。', '例えば', '、', '歓送', '迎', '会', 'など', '飲み', '会', 'が', 'かなり', 'の', '頻度', 'で', '開催', 'さ', 'れる', 'この', '時期', 'は', '“', '女', 'の', '勘', '”', 'が', 'フル', '稼働', 'する', 'の', 'で', 'は', 'ない', 'だろ', 'う', 'か', '。', '歓迎', '会', 'で', 'は', '新しい', '顔ぶれ', 'に', '妙', 'な', '新鮮味', 'を', '覚え', 'て', 'しまっ', 'たり', '、', '送別', '会', 'で', '普段', 'は', '意識', 'し', 'ない', '相手', 'に対して', '寂寥', '感', 'を', '覚え', 'て', '、', 'つい', '親密', 'に', 'なっ', 'て', 'しまう', '、', 'という', '可能', '性', 'だって', '否定', 'は', 'でき', 'ない', '。', 'そんな', '時期', 'だ', 'から', 'こそ', '相手', 'に', '微妙', 'な', '変化', 'が', 'ある', 'と', '、', '(', '急', 'に', '優しく', 'なっ', 'たり', '、', 'あまり', '目', 'を', '合わせ', 'なく', 'なっ', 'たり', '、', '持ち物', '・', '服', '・', '食べ物', 'の', '好み', 'が', '変わる', 'など', ')', '誰', 'でも', '不安', 'に', 'なる', 'もの', '。', 'そして', '女性', 'の', '多く', 'は', '、', 'すべて', 'の', 'データ', 'の', '中', 'から', '「', 'この', '納得', 'の', 'いか', 'ない', '違和感', 'は', '何', 'な', 'の', 'か', '?', '」', 'という', '情報', 'を', '引き出し', '、', '判断', 'の', '基準', 'に', 'する', 'の', 'だ', '。', '恋人', 'が', 'いる', '方', 'は', '、', 'そんな', '不安', 'を', '抱え', 'ず', 'に', 'すむ', 'よう', 'に', '、', '相手', 'の', '気持ち', 'を', 'しっかり', 'と', '握る', 'こと', 'が', '大切', 'に', 'なっ', 'て', 'くる', '。', 'しかし', '、', '時に', '“', '恋', 'は', '盲目', '”', 'に', 'なる', 'もの', '。', 'そんな', '時', 'に', 'こそ', '気', 'を', 'つけ', 'て', 'いただき', 'たい', 'の', 'が', '、', '自身', 'が', '浮気', '・', '不倫', '相手', 'に', 'なっ', 'て', 'しまっ', 'て', 'い', 'ない', 'か', '、', 'という', 'こと', 'だ', '。', '例えば', '厚生', '労働省', 'の', '「', '2008', '年', '\u3000', '第', '4', '回', '男女', 'の', '生活', 'と', '意識', 'に関する', '調査', '(', '16', '歳', '〜', '49', '歳', 'の', '男女', '1468', '人', 'を', '対象', ')」', 'に', 'よれ', 'ば', '、', '既婚', '男性', 'における', '「', '過去', '1', '年間', 'に', '複数', 'の', 'パートナー', 'と', '性的', 'な', '関係', 'を', '持っ', 'た', '割合', '」', 'は', '35', '歳', '未満', 'で', 'は', '4', '.', '6', '%、', '35', '歳', '以上', 'は', '15', '.', '8', '%', 'に', 'のぼっ', 'た', 'と', 'いう', '。', 'つまり', '、', '10', '人', 'に', '一', '人', '以上', 'の', '割合', 'で', '男性', 'は', '浮気', '・', '不倫', 'を', 'し', 'て', 'いる', '人', 'が', 'いる', 'という', 'こと', 'だ', '。', '特に', '最近', 'の', '若年', '層', 'の', '男性', 'における', 'セックス', '離れ', 'を', '考える', 'と', '、', '年齢', 'が', '高く', 'なる', 'につれて', '、', '女性', '関係', 'が', '派手', 'な', '男性', 'が', '増加', 'し', 'て', 'いる', 'の', 'で', 'は', 'ない', 'だろ', 'う', 'か', '。', '運', '悪く', '不倫', '相手', 'と', 'なっ', 'て', 'しまっ', 'た', '場合', '、', '男性', 'の', 'パートナー', '(', '相手', 'の', '奥さん', ')', 'から', '訴訟', 'を', '起こさ', 'れ', '、', '損害', '賠償', 'を', '請求', 'さ', 'れる', 'こと', 'も', '無い', '話', 'で', 'は', 'ない', '。', 'ちなみに', 'その', '慰謝', '料', 'は', '心', 'の', '損害', 'で', 'ある', 'こと', 'から', '、', 'ケースバイケース', 'に', 'なる', 'が', '、', 'おおよそ', '50', '万', '円', 'から', '300', '万', '円', 'という', '場合', 'が', '多い', 'と', 'いう', '。', '独', '女', 'の', '方々', 'の', '中', 'に', 'は', '真剣', 'に', '生涯', 'の', 'パートナー', 'を', '探し', 'て', 'いる', '方', 'も', '多い', 'だろ', 'う', '。', 'だからこそ', '、', 'そんな', '心', 'の', '隙間', 'に', '入り込ん', 'で', 'くる', '男性', 'の', '本性', 'を', '見破る', 'こと', 'は', 'とても', '難しい', '。', '最近', 'で', 'は', '特に', '結婚', 'し', 'て', 'い', 'なく', 'て', 'も', '、', '相手', 'に', '浮気', 'や', '不倫', 'の', 'そ', 'ぶり', 'が', 'あれ', 'ば', '、', '探偵', '会社', 'に', '浮気', '調査', 'を', '依頼', 'する', '女性', 'も', '多い', 'と', 'いう', '。', '1', '日', 'だけ', 'の', '調査', 'も', '引き受け', 'て', 'くれる', 'し', '、', 'クレジットカード', '払い', 'も', '可能', 'に', 'なる', 'など', '意外と', '身近', 'に', 'なっ', 'て', 'き', 'た', 'の', 'で', 'は', 'ない', 'だろ', 'う', 'か', '。', '確か', 'に', '、', '万が一', 'に', 'も', '自分', 'が', '不倫', '相手', 'など', 'に', 'なっ', 'て', 'しまっ', 'た', '時', 'の', 'リスク', 'を', '考えれ', 'ば', '、', 'こう', 'いっ', 'た', '調査', 'の', 'プロ', 'に', '依頼', 'し', 'て', 'しまう', 'の', 'も', '一つ', 'の', '賢い', '選択', 'な', 'の', 'かも', 'しれ', 'ない', '。', 'もちろん', '、', 'そういった', '行為', '自体', 'は', '一時', '的', 'に', '相手', 'を', '疑う', 'こと', 'に', 'なっ', 'て', 'しまう', '。', 'しかし', '、', '”', 'シロ', '”', 'と', '分かれ', 'ば', '、', 'より', 'いっそう', 'パートナー', 'を', '信頼', 'する', '裏付け', 'と', 'なる', 'こと', 'は', '間違い', 'ない', 'はず', 'だ', '。', '■', '関連', 'リンク', '探偵', '会社', 'の', '詳細', 'は', 'こちら'], tags=['d3']),
TaggedDocument(words=['髪', '以外', 'に', '白髪', '発見', '!', ' ', 'あなた', 'は', 'どこ', 'に', '?', '初めて', '髪', 'に', '「', '白い', '1', '本', '」', 'を', '見つけ', 'た', 'の', 'は', '20', '代', '後半', 'の', 'とき', '、', 'という', '優香', 'さん', '(', '40', '歳', '・', 'コピーライター', ')', '。', '「', '徹夜', 'も', 'よく', 'し', 'て', 'い', 'た', 'し', '、', '当時', 'の', '職場', 'で', 'は', 'いろいろ', 'ストレス', 'を', '感じ', 'て', 'い', 'た', 'ので', '、', 'その', 'せい', 'か', 'と', '思っ', 'て', 'まし', 'た', 'が', '…', '…', '」', '。', '30', '代', '前半', 'で', '退職', 'し', 'フリー', 'に', 'なり', '、', 'ストレス', 'も', 'なくなっ', 'た', 'のに', '白髪', 'は', 'その後', 'も', '増える', '一方', '。', '白髪染め', 'は', '欠か', 'せ', 'なく', 'なっ', 'て', '久しい', '。', '年齢', '的', 'な', 'もの', 'か', 'と', 'あきらめ', 'て', 'は', 'いる', 'が', '、', '友人', 'たち', 'と', '集まっ', 'た', 'とき', '、', 'つい', 'ぼやい', 'て', 'しまっ', 'た', '。', 'ところが', '、', '居合わせ', 'た', '友人', 'から', 'は', '意外', 'な', '告白', 'が', 'あっ', 'た', 'と', 'いう', '。', '頭髪', 'の', '白髪', 'は', '数', '本', '、', 'という', '智子', 'さん', '(', '38', '歳', '・', 'デザイナー', ')', 'は', '、', '「', '髪', 'も', '気', 'に', 'なる', 'けど', 'ね', '、', '実は', '…', '…', '」', 'と', '切り出し', 'た', '。', '「', '鼻', 'の', '下', 'の', '産毛', 'が', '気', 'に', 'なっ', 'て', 'い', 'た', 'から', '脱毛', 'に', '通っ', 'て', 'いる', 'の', 'だ', 'けど', '、', '経過', 'は', 'どう', 'か', 'と', '鏡', 'を', '見', 'て', 'い', 'たら', '、', 'なんと', '1', '本', '、', '白髪', 'が', 'あっ', 'た', 'の', 'よ', '〜', '!', '」', '。', '施術', 'は', '、', '黒い', '毛根', 'に', 'ダメージ', 'を', '与える', '光', '脱毛', 'という', 'もの', 'な', 'ので', '、', '「', '白髪', 'だ', 'と', '毛根', 'も', '白い', 'だろ', 'う', 'から', '、', 'ここ', 'だけ', 'は', '脱毛', 'さ', 'れ', 'な', 'さ', 'そう', '…', '…', '」', 'と', '残念', 'そう', 'だっ', 'た', 'と', 'いう', '。', '里美', 'さん', '(', '35', '歳', '・', '編集', '者', ')', 'は', '、', '「', '私', 'だけ', 'じゃ', 'なかっ', 'た', 'ん', 'です', 'ね', '!', ' ', '私', 'の', '場合', 'は', 'まゆ毛', '!', ' ', 'しかも', 'なぜ', 'か', '左', 'だけ', '。', '数え', 'たら', '4', '本', 'も', 'あっ', 'て', 'びっくり', '。', '髪の毛', 'より', 'まゆ毛', 'が', '先', 'に', '白く', 'なる', 'なんて', '…', '…', '」', 'と', '苦笑', '。', '髪', 'は', '黒', '々', 'として', 'い', 'て', '染め', 'て', 'も', 'い', 'ない', '陽子', 'さん', '(', '41', '歳', '・', '整体', '師', ')', 'も', '「', '私', 'は', 'アンダー', 'ヘア', 'に', '1', '本', '」', 'と', '、', '続々', 'カミングアウト', '。', '海外', 'ドラマ', '『', 'SEX', ' ', 'AND', ' ', 'THE', ' ', 'CITY', '』', 'ファン', 'の', '優香', 'さん', 'が', 'それ', 'を', '聞い', 'て', '思い出し', 'た', 'の', 'は', '、', '仲間', 'の', '最年長', 'の', 'サマンサ', 'が', 'アンダー', 'ヘア', 'に', '白髪', 'を', '見つけ', 'ショック', 'を', '受け', 'た', 'エピソード', '。', 'ドラマ', 'で', 'は', '染め', 'て', '失敗', 'し', 'て', 'い', 'た', 'が', '…', '…', '。', 'それで', 'みんな', 'は', 'どう', '対処', 'し', 'た', 'の', 'か', 'と', '聞い', 'て', 'み', 'た', '。', '脱毛', '中', 'の', '智子', 'さん', 'は', '、', '「', '抜く', 'の', 'は', '肌', 'に', 'よく', 'ない', 'と', 'サロン', 'で', '言わ', 'れ', 'た', 'し', '、', '脱毛', '効果', 'も', '薄れる', 'ので', '、', '剃っ', 'て', 'いる', '」', '。', 'あと', 'の', '2', '人', 'は', '抜い', 'た', 'と', 'いう', '。', 'ちなみに', '抜い', 'て', 'も', '、', 'また', 'そこ', 'から', '白髪', 'が', '生え', 'て', 'くる', 'ので', '、', '抜く', 'の', 'は', 'その', '場', 'しのぎ', 'に', 'しか', 'なら', 'ない', '。', '優香', 'さん', 'は', 'みんな', 'の', '話', 'を', '聞い', 'て', '、', '「', '白髪', 'の', '量', 'で', 'いえ', 'ば', '私', 'が', '一番', 'です', 'が', '、', '頭髪', 'は', '染める', 'の', 'が', '手軽', '。', 'みんな', 'より', 'ケア', 'は', '楽', 'な', '方', 'かも', '」', 'と', '思っ', 'た', 'と', 'いう', '。', 'と', 'は', 'いえ', '、', '次に', 'どこ', 'に', '白髪', 'が', '発見', 'さ', 'れる', 'か', 'は', '未知数', 'で', '、', '人', 'ごと', 'で', 'は', 'ない', '。', '「', '男性', 'だっ', 'たら', 'ヒゲ', 'に', '白い', 'もの', 'が', '混じっ', 'て', 'い', 'て', 'も', '大人', 'の', '魅力', 'と', 'も', '取れ', 'ます', 'が', '、', '女', 'は', 'ねえ', '…', '…', '。', '数', '本', 'の', 'うち', 'は', 'まだ', '笑い飛ばせる', 'けど', '、', 'これ', '以上', '増やさ', 'ない', 'に', 'は', 'どう', 'し', 'たら', 'いい', 'ん', 'だろ', 'う', 'って', '、', 'その', 'あと', 'ずいぶん', '話', 'が', '盛り上がり', 'まし', 'た', 'よ', '」', '。', '黒', '々', 'と', 'し', 'た', '髪', 'の', '陽子', 'さん', 'が', '「', '私', 'は', 'よく', '食べ', 'てる', 'けど', '、', '黒い', '食べ物', 'が', 'いい', 'らしい', 'よ', '。', '海藻', '類', 'や', '黒', 'ごま', 'とか', '」', 'と', '言う', 'の', 'が', '妙', 'に', '説得', '力', 'が', 'あっ', 'た', 'そう', 'だ', '。', 'その', 'ほか', '、', '牡蛎', 'や', 'シジミ', 'に', '含ま', 'れる', '亜鉛', 'や', 'カルシウム', 'など', 'の', 'ミネラル', 'も', 'いい', 'と', 'いう', '。', '白髪', 'の', '原因', 'に', 'は', 'まだ', '謎', 'が', '多く', '、', '加', '齢', 'の', 'ほか', '遺伝', '、', 'ストレス', '、', '紫外線', 'による', 'DNA', 'の', '損傷', 'など', '諸説', 'ある', 'が', '、', '血', '流', '不足', 'も', '一因', 'と', 'いわ', 'れ', 'て', 'いる', '。', '優香', 'さん', 'は', '何', '度', 'か', 'ヘッド', 'マッサージ', 'を', '受け', 'た', 'とき', '、', '頭', 'が', '凝っ', 'て', 'いる', 'と', '言わ', 'れ', 'た', 'こと', 'が', 'ある', '。', '「', '頭', 'なら', 'マッサージ', 'し', 'やすい', 'から', '自分', 'で', 'も', 'やろ', 'う', '、', 'と', '思い', 'つつ', '、', 'なかなか', '…', '…', '。', 'でも', '、', 'これから', 'は', '心', 'を', '改め', 'ます', '」', 'と', '、', '髪', 'に', 'いい', 'という', 'セサミオイル', 'を', '購入', 'し', '、', 'ヘッド', 'マッサージ', 'を', '始め', 'た', '。', 'まゆ毛', 'に', '白髪', 'の', '里美', 'さん', 'も', '、', '「', 'まゆ毛', '周囲', 'は', 'ツボ', 'も', 'あっ', 'て', '押す', 'と', '気持ちいい', 'し', '、', '目', 'の', '疲れ', 'に', 'も', 'いい', 'から', '、', '指圧', 'を', '心掛ける', 'よう', 'に', 'なり', 'まし', 'た', '」', '。', 'その後', 'の', '改善', 'に', 'つながる', 'か', 'は', 'まだ', 'なんとも', 'いえ', 'ない', 'が', '、', '体', 'の', 'ため', 'に', 'は', 'プラス', 'で', 'ある', 'はず', 'だ', '。', '自分', 'と', 'は', 'まだまだ', '関係', 'の', 'ない', '話', '、', 'と', '思っ', 'て', 'いる', 'あなた', 'も', '、', 'ひょっとしたら', '明日', 'は', '我が身', '!', '?', '\u3000', '偏食', 'や', '不規則', 'で', 'ストレス', 'フル', 'な', '生活', 'を', '送っ', 'て', 'いる', 'と', '、', '白髪', 'を', '増やす', 'かも', '?', '\u3000', '髪', 'も', 'ムダ', '毛', 'も', '体', 'の', '一部', '。', '白髪', 'に', 'なっ', 'て', 'から', 'で', 'は', 'なく', '、', '普段', 'から', 'いたわっ', 'て', 'いき', 'ましょ', 'う', '。', '(', 'オフィスエムツー', '/', 'オオノマキ', ')'], tags=['d4']),
TaggedDocument(words=['広がる', 'お', 'ひとり', 'さま', 'の', '行動', '網', '!', '一', '人', 'で', 'ライブ', '参戦', '!', '着実', 'に', '広がり', 'つつ', 'ある', '女性', 'たち', 'の', '一', '人', '行動', '網', '。', '今や', '一', '人', 'カフェ', 'は', '当たりまえ', 'だ', 'し', '、', '一', '人', '牛', '丼', 'や', '一', '人', '焼き肉', '、', '一', '人', '居酒屋', 'が', 'OK', 'という', '女性', 'も', '確実', 'に', '増え', 'て', 'いる', '。', '6', '月', '3', '日', 'に', '放送', 'さ', 'れ', 'た', 'NHK', '「', '50', 'ボイス', '」', 'で', 'は', '、', '一', '人', 'で', 'キャンプ', 'や', '登山', 'など', '、', 'アウトドア', 'を', '楽しむ', '女性', 'が', '次々', 'に', '紹介', 'さ', 'れ', '、', 'その', '行動', '力', 'や', '明る', 'さ', 'に', '驚かさ', 'れ', 'た', '。', 'そんな', '中', '、', '私', 'が', '気', 'に', 'なっ', 'て', 'いる', 'の', 'は', '、', '一', '人', 'で', 'ライブ', 'に', '参加', 'する', '女性', 'たち', 'の', 'こと', '。', ' ', '行く', '前', 'と', '後で', 'は', '、', '敷居', 'の', '高', 'さ', 'が', '驚く', 'ほど', '変わる', 'らしい', '。', '「', '話す', '人', 'が', 'い', 'ない', '寂し', 'さ', 'を', '感じる', 'の', 'は', '、', 'ライブ', 'が', '始まる', '前', 'くらい', '。', 'それ', 'も', 'メール', 'を', 'し', 'たり', '、', '音楽', 'を', '聞い', 'たり', 'すれ', 'ば', 'あっという間', 'です', '。', 'ライブ', 'が', '始まっ', 'て', 'しまえ', 'ば', '、', '楽しい', '!', ' ', 'だけ', 'です', 'よ', '」', 'と', '話し', 'て', 'くれ', 'た', 'の', 'は', '、', '今年', '5', '月', '、', '初めて', '一', '人', 'で', '「', 'ライブ', '参戦', '」', 'し', 'て', 'き', 'た', 'ナナ', 'さん', '(', '28', '歳', '・', '会社', '員', ')', '。', '今', 'まで', '彼', 'や', '友だち', 'と', '一緒', 'に', 'ライブ', 'に', '行く', 'こと', 'は', 'あっ', 'た', 'そう', 'だ', 'が', '…', '。', '「', '一', '人', 'で', 'ライブ', 'に', '来', 'て', 'いる', '人', 'を', '見る', '度', 'に', '、', 'なんか', '寂し', 'そう', 'って', '思っ', 'て', 'い', 'た', 'から', '、', '一', '人', 'で', '参加', 'する', 'の', 'は', '抵抗', 'が', 'あり', 'まし', 'た', '。', 'でも', '、', '実際', 'に', '行っ', 'て', 'み', 'たら', '、', '一緒', 'に', '行っ', 'た', '人', 'が', '楽しん', 'で', 'いる', 'か', 'どう', 'か', '気', 'に', 'し', 'なく', 'て', 'いい', 'ので', '気', 'が', '楽', '!', ' ', '思い切り', '楽しめ', 'まし', 'た', '」', '(', 'ナナ', 'さん', ')', 'ここ', '1', '〜', '2', '年', '、', '一', '人', 'で', 'の', '「', 'ライブ', '参戦', '」', 'が', '増え', 'て', 'いる', 'ムツ', 'ミ', 'さん', '(', '33', '歳', '・', '派遣', ')', 'の', '場合', 'は', '、', '10', '歳', '年下', 'の', '従姉妹', 'が', 'きっかけ', '。', '「', '久しぶり', 'に', '会っ', 'た', '従姉妹', 'から', '、', '一', '人', 'で', '武道', '館', 'や', '味の素', 'スタジアム', 'の', 'ライブ', 'に', '行っ', 'て', 'いる', 'と', '聞い', 'て', 'ビックリ', 'し', 'まし', 'た', '。', '『', '一', '人', 'で', '行っ', 'て', '恐く', 'ない', '?', '』', 'って', '聞い', 'て', '笑わ', 'れ', 'まし', 'た', 'よ', '。', '『', '一', '人', 'で', '来', 'て', 'いる', '女の子', 'も', '普通', 'に', '見かける', 'よ', '』', 'って', '言わ', 'れ', 'ちゃい', 'まし', 'た', '」', 'と', 'ムツ', 'ミ', 'さん', '。', 'その後', '、', '一', '人', 'で', 'ライブ', 'に', '行く', 'コツ', 'を', '従姉妹', 'から', '教わっ', 'た', 'の', 'だ', 'と', 'か', '。', '「', '初めて', '一', '人', 'で', 'ライブ', 'に', '行く', 'なら', '、', '小さい', '会場', 'より', '大きな', '会場', '、', 'スタンディング', 'より', '座席', '指定', 'が', 'いい', 'とか', 'アドバイス', 'し', 'て', 'もらい', 'まし', 'た', '。', '『', '大好き', 'な', 'アーティスト', 'の', 'ライブ', 'を', '一緒', 'に', '行く', '人', 'が', 'い', 'ない', 'っていう', 'だけ', 'で', '、', 'あきらめ', 'たく', 'ない', 'じゃ', 'ない', '』', 'という', '従姉妹', 'の', '言葉', 'が', '忘れ', 'られ', 'ませ', 'ん', '」', '最近', 'は', '、', 'SNS', 'や', 'ファン', 'サイト', 'の', '掲示板', 'を', '上手', 'に', '使っ', 'て', '、', 'ライブ', 'を', '楽しん', 'で', 'いる', '女性', 'も', '多い', '。', 'アサコ', 'さん', '(', '28', '歳', '・', '医療', '関連', ')', 'も', 'そんな', '女性', 'の', '一', '人', '。', '「', '私', 'の', '場合', 'は', '、', '身近', 'に', '同じ', 'アーティスト', 'を', '好き', 'な', '友だち', 'が', 'い', 'ない', 'ので', '、', '基本', 'は', '『', '一', '人', '参戦', '』', 'です', 'が', '、', '会場', 'で', 'mixi', 'の', 'コミュニティ', 'で', '知り合っ', 'た', '北海道', 'や', '大阪', 'の', '友だち', 'と', '会う', 'こと', 'も', '多い', 'です', '。', '普段', 'は', 'ネット', 'で', '話し', 'て', 'いる', '友だち', 'と', 'リアル', 'で', '会える', 'の', 'も', '、', 'ライブ', 'の', '楽しみ', 'の', 'ひとつ', 'です', '」', 'と', '話し', 'て', 'くれ', 'た', '。', 'アサコ', 'さん', 'は', '、', '一', '人', 'で', 'ライブ', 'に', '来', 'て', 'いる', 'らしい', '女性', 'を', '見かける', 'と', '積極', '的', 'に', '声', 'を', 'かける', '。', '「', '同じ', 'アーティスト', 'が', '好き', 'だ', 'から', '、', 'すぐ', 'に', '意気投合', 'する', 'こと', 'が', '多い', 'です', 'し', '、', 'ライブ', 'の', '後', '、', '初対面', 'の', '人', 'と', '駅', 'まで', '語りあっ', 'た', 'こと', 'も', 'あり', 'ます', '。', '最近', 'は', '、', '韓国', '人', 'の', '女の子', 'と', '知り合い', 'に', 'なり', 'まし', 'た', '。', 'その', 'アーティスト', 'が', '大好き', 'で', '、', '日本', 'に', '留学', 'し', 'て', 'いる', 'そう', 'です', '。', '初対面', 'で', 'も', 'お互い', '一', '人', 'だ', 'から', '話し', 'やすい', 'の', 'かも', 'しれ', 'ませ', 'ん', '」', '(', 'アサコ', 'さん', ')', 'アーティスト', 'によって', 'ライブ', 'の', '雰囲気', 'は', 'かなり', '違う', '。', 'ファン', 'の', '年齢', '層', 'によって', 'も', '、', '雰囲気', 'も', '変わっ', 'て', 'くる', '。', '始めて', '会っ', 'た', 'ファン', '同士', 'で', 'も', '、', 'すぐ', 'に', '意気投合', 'できる', 'ライブ', 'も', '少なく', 'ない', '。', 'ただ', '、', 'コア', 'な', 'ファン', 'で', 'ガッチリ', '固め', 'られ', 'た', 'ライブ', 'の', '場合', 'は', '、', '「', '一', '人', 'ライブ', '初心者', '」', 'に', 'は', 'ハードル', 'が', '高い', 'だろ', 'う', '。', 'また', '、', '「', 'ファン', 'の', 'マナー', 'が', '悪い', '」', 'という', '評判', 'が', 'ある', 'ライブ', 'に', '「', '一', '人', '参戦', '」', 'する', 'とき', 'は', '、', 'それなり', 'の', '注意', 'が', '必要', 'かも', 'しれ', 'ない', '。', 'ライブ', 'の', '雰囲気', 'が', '気', 'に', 'なる', 'とき', 'は', '、', 'アーティスト', '名', '+', 'ライブ', '、', 'もしくは', 'ライブ', 'レポート', 'で', '検索', 'する', 'の', 'が', 'お', 'ススメ', '。', 'ライブ', 'レポート', 'が', '書か', 'れ', 'た', 'ブログ', 'が', '多数', 'ヒット', 'する', 'だろ', 'う', '。', '50', '代', 'の', '知人', '女性', 'は', '、', '今年', '始め', 'て', '一', '人', 'で', 'B', "'", 'z', 'の', 'ライブ', 'に', '行く', 'と', 'いう', '。', '偶然', '見', 'た', 'B', "'", 'z', 'の', '情報', '交換', 'サイト', 'で', '、', '同', '世代', 'の', '人', 'が', 'ライブ', 'に', '参加', 'し', 'て', 'いる', 'って', '知っ', 'て', '、', 'い', 'て', 'も', '立っ', 'て', 'も', 'い', 'られ', 'なく', 'なっ', 'た', 'そう', 'だ', '。', '「', 'ファン', '歴', 'は', '長い', 'のに', '、', 'ライブ', 'に', '行く', 'チャンス', 'が', 'なかっ', 'た', 'の', '。', '20', '代', 'の', '頃', 'だっ', 'たら', '、', 'とても', '一', '人', 'で', '行く', '勇気', 'は', 'なかっ', 'た', 'けど', '、', '人生', 'は', '一', '度', 'きり', 'だ', 'と', '思っ', 'たら', '絶対', 'に', '行き', 'たい', 'と', '思っ', 'た', 'の', 'よ', '」', 'と', '話し', 'て', 'くれ', 'た', '。', 'もうすぐ', '夏', 'フェス', 'の', '季節', 'が', 'やってくる', '。', 'チケット', 'を', '入手', 'し', 'たら', '、', '事前', 'の', '情報', 'を', '十分', 'チェック', '!', ' ', '熱中', '症', '対策', 'も', '抜かり', 'なく', '!', ' ', 'お', 'ひとり', 'さま', 'だって', 'ライブ', 'を', '思い切り', '楽しも', 'う', '!', '(', 'オフィスエムツー', '/', '神田', 'はる', 'ひ', ')', ' ', '■', '関連', '記事', '・', 'ランクづけ', 'に', '見る', '独', '女', 'たち', 'の', 'プライド', '・', '悩ましき', '女', '友だち', 'と', 'の', '格差', '問題', '・', '【', '独', '女', '的', 'コミック', 'レビュー', '】', 'vol', '.', '4', '『', '遠野', '物語', '』', '・', '独', '女', '的', '映画', 'レビュー', ' ', 'vol', '.', '11', '\u3000', '『', '食べ', 'て', '、', '祈っ', 'て', '、', '恋', 'を', 'し', 'て', '』', '・', 'キス', 'シーン', 'だらけ', 'の', 'DVD', '、', 'あなた', 'は', 'ウットリ', 'し', 'ます', 'か', '?'], tags=['d5'])]


続いて、Doc2Vecを実装します。


先ほどimportしたDoc2Vecをつかって学習するのですが、その際にdocumentsに、配列データとして組み込んだtraining_docsを指定します。


Doc2Vecの実装
1
2
3
4
5
6
model = Doc2Vec(documents=training_docs, 
vector_size=100,
min_count=1,
window=5,
epochs=20,
dm=1)


各引数は、以下のとおりです。


  • vector_size: 分散表現の次元数
  • window: 対象単語を中心とした前途の単語数
  • min_count: 学習に使う単語の最低出現回数
  • epochs: エポック数
  • dm: 学習モデルの指定。dm=0でDBoW。dm=1でdmpv。

6. 類似度計算の実施


作成したdoc2vecのモデルを用いて、類似度計算してみましょう。


ここでは簡単に、doc[0]の文章(「東京23区女ひとり風呂 vol.03「台東区・銭湯でアレ発見!」・・・・」)に対して、他の4つの文章のどれが最も類似度の高いかを算出してみます。


model.docvecs.most_similar(0)とすることで、IDが0の文章、すなわち最初の文章と最も類似度の高い文章が表示されます。


1
print(model.docvecs.most_similar(0))


以下のように出力されるかと思います。

1
[('d1', 0.8035883903503418), ('d4', 0.7881282567977905), ('d2', 0.6919220685958862), ('d3', 0.6860525608062744), ('d5', 0.5887612104415894)]


このことからid:1の文章が、もっとも類似度が高いことが分かります。

まとめ: Doc2vecを実装しながら学びました。


本記事は、「【自然言語処理】Google Colaboratoryでdoc2vecを実装してみよう!」というテーマでまとめました。


本ブログでは、word2vecについても実装しながらまとめていますので、興味のある方は以下の記事も参照してください。


>>Word2vecも学ぶ



また、基礎から応用まで自然言語処理を学んでみたいという方は、以下のUdemyの講座がおすすめです。

自然言語処理とチャットボット: AIによる文章生成と会話エンジン開発

Udemyは、30日間返金保証付きで、視聴期限が無期限のオンライン学習プラットフォームです。

自然言語処理以外にも、世界中の一流エンジニアが様々なICT技術に関する講義動画を提供してくれていますので、興味のある方はUdemyが提供している講座を確認してみてください。

コメント