<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: 「日本語スペルチェック」、「表記のゆれ」：API化して欲しい！</title>
	<atom:link href="http://blog.zuzara.com/2006/06/24/92/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.zuzara.com/2006/06/24/92/</link>
	<description>いじる、つくる、感動する</description>
	<lastBuildDate>Fri, 23 Jul 2010 23:12:36 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
	<item>
		<title>By: 【ネタの種】参考サイトのURL付きで &#124; 東京ヘッドターミナル</title>
		<link>http://blog.zuzara.com/2006/06/24/92/comment-page-1/#comment-44236</link>
		<dc:creator>【ネタの種】参考サイトのURL付きで &#124; 東京ヘッドターミナル</dc:creator>
		<pubDate>Tue, 20 Jan 2009 09:52:20 +0000</pubDate>
		<guid isPermaLink="false">http://blog.zuzara.com/2006/06/24/92/#comment-44236</guid>
		<description>[...] &#187;zuzara : 「日本語スペルチェック」、「表記のゆれ」：API化して欲しい！ &#187;スラッシュドット・ジャパン &#124; ジャストシステム、ATOKを月額300円で提供へ [...]</description>
		<content:encoded><![CDATA[<p>[...] &raquo;zuzara : 「日本語スペルチェック」、「表記のゆれ」：API化して欲しい！ &raquo;スラッシュドット・ジャパン | ジャストシステム、ATOKを月額300円で提供へ [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: funaki</title>
		<link>http://blog.zuzara.com/2006/06/24/92/comment-page-1/#comment-938</link>
		<dc:creator>funaki</dc:creator>
		<pubDate>Mon, 26 Jun 2006 00:18:45 +0000</pubDate>
		<guid isPermaLink="false">http://blog.zuzara.com/2006/06/24/92/#comment-938</guid>
		<description>ぁ、gooもその辺強いんでした。
タウンページを部分的に漢字にしたものは、gooとGoogleでは同じ結果。
「引っ越し」は差異が見られました。「じーこ」も修正候補を出してくれますね。</description>
		<content:encoded><![CDATA[<p>ぁ、gooもその辺強いんでした。<br />
タウンページを部分的に漢字にしたものは、gooとGoogleでは同じ結果。<br />
「引っ越し」は差異が見られました。「じーこ」も修正候補を出してくれますね。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: itochan</title>
		<link>http://blog.zuzara.com/2006/06/24/92/comment-page-1/#comment-922</link>
		<dc:creator>itochan</dc:creator>
		<pubDate>Sat, 24 Jun 2006 16:24:30 +0000</pubDate>
		<guid isPermaLink="false">http://blog.zuzara.com/2006/06/24/92/#comment-922</guid>
		<description>Googleではなく、「Goo」とで比較してみてください。
http://internet.watch.impress.co.jp/cda/news/2003/12/01/1313.html

あまり知られてないのかな？</description>
		<content:encoded><![CDATA[<p>Googleではなく、「Goo」とで比較してみてください。<br />
<a href="http://internet.watch.impress.co.jp/cda/news/2003/12/01/1313.html" rel="nofollow" onclick="pageTracker._trackPageview('/outgoing/internet.watch.impress.co.jp/cda/news/2003/12/01/1313.html?referer=');">http://internet.watch.impress.co.jp/cda/news/2003/12/01/1313.html</a></p>
<p>あまり知られてないのかな？</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: funaki</title>
		<link>http://blog.zuzara.com/2006/06/24/92/comment-page-1/#comment-919</link>
		<dc:creator>funaki</dc:creator>
		<pubDate>Sat, 24 Jun 2006 07:58:47 +0000</pubDate>
		<guid isPermaLink="false">http://blog.zuzara.com/2006/06/24/92/#comment-919</guid>
		<description>なるほど。
英語や日本語対象の既存研究はありそう。表記のゆれって中国語や韓国語にもあるんでしょうか？あるとしたらその辺の研究の進み具合も気になるところ。

統計的確率論で言語を解析--Sematicsが世界初の日本語解析エンジンを開発 - CNET Japan
http://japan.cnet.com/news/ent/story/0,2000056022,20142328,00.htm

これの要約も気になるところだよね。</description>
		<content:encoded><![CDATA[<p>なるほど。<br />
英語や日本語対象の既存研究はありそう。表記のゆれって中国語や韓国語にもあるんでしょうか？あるとしたらその辺の研究の進み具合も気になるところ。</p>
<p>統計的確率論で言語を解析&#8211;Sematicsが世界初の日本語解析エンジンを開発 &#8211; CNET Japan<br />
<a href="http://japan.cnet.com/news/ent/story/0,2000056022,20142328,00.htm" rel="nofollow" onclick="pageTracker._trackPageview('/outgoing/japan.cnet.com/news/ent/story/0_2000056022_20142328_00.htm?referer=');">http://japan.cnet.com/news/ent/story/0,2000056022,20142328,00.htm</a></p>
<p>これの要約も気になるところだよね。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: unno</title>
		<link>http://blog.zuzara.com/2006/06/24/92/comment-page-1/#comment-918</link>
		<dc:creator>unno</dc:creator>
		<pubDate>Sat, 24 Jun 2006 06:06:39 +0000</pubDate>
		<guid isPermaLink="false">http://blog.zuzara.com/2006/06/24/92/#comment-918</guid>
		<description>google は、読み方ベースで処理してないと思いますよ。
つまり、同じ IP address から受け取った、一定時間内の QUERY を同一単語の書き直しと見なして、学習してるんじゃないでしょうかね。
上のような表記揺れだと、自動で学習するとしても結構「知識」を入れない難しそうです。
揺れの種類をルール化して、確率モデルでむにゃむにゃむにゃ。
おもしろそうだけど、すでに既存研究がたくさんありそう。
そういえば、ウチの研究室で未知略語の自動復元（？）みたいなのを聞いたことあります。</description>
		<content:encoded><![CDATA[<p>google は、読み方ベースで処理してないと思いますよ。<br />
つまり、同じ IP address から受け取った、一定時間内の QUERY を同一単語の書き直しと見なして、学習してるんじゃないでしょうかね。<br />
上のような表記揺れだと、自動で学習するとしても結構「知識」を入れない難しそうです。<br />
揺れの種類をルール化して、確率モデルでむにゃむにゃむにゃ。<br />
おもしろそうだけど、すでに既存研究がたくさんありそう。<br />
そういえば、ウチの研究室で未知略語の自動復元（？）みたいなのを聞いたことあります。</p>
]]></content:encoded>
	</item>
</channel>
</rss>
