Monday, December 22, 2014

ගුගල් පරිවර්තකය සහ සිංහල භාෂාව සහ අනාගතය.(Future of Google Sinhala Translator)


මෑතකදී ගුගල් සිංහල පරිවර්තකය වැඩ අරඹන ලදී. ඒය ක්‍රියාත්මක වූ විට හුරේ කියා ඇතැම්හු ලිපි පළකලද. මටනම් එය ලොකු ජයක් නොවේ. මෙය මේ මට්ටමට ක්‍රියාත්මක කිරීමට හැකිවීම පිළිබඳව  ඒ සඳහා මහන්සි වූ සැමට ස්තුතිය පිරිනැමිය යුතුය. මෙහි ඉදිරිය යහපත් කිරීම ගුගල් සතු වගකීමක් නොව අප සතු වගකීමකි. අපගේ යුතුකම නම් එය භාවිතා කර එහි වැරදි පෙන්වා දීමයි. දැනට පරිවර්තකය වැඩ කලද එය ප්‍රයෝගිකව සාර්ථක නොවේ. එසේ වුවත් අඩු තරමින් දිනකට වාක්‍ය 10 හෝ සහිත ලිපියක් එමගින් පරිවර්තනය කර එහි වැරදි අපි පෙන්වාදෙන්නේ නම්. ඉංග්‍රීසි බැරි අපගේ හිතවතුන්ට එය අනගාතයෙදී ලොකු උපකාරයක් වනු නියතය.
මුලින්ම එය ප්‍රයෝගිකව කරන ආකාරය සලකා බලමු 

මෙහි සිංහල පරිවර්තනය පෙන්වන කොටුව පහල වම් පැත්තේ ඇති පැන්සල සහිත අයිකනය ක්ලික් කරන්න. ඉන්පසු 
නිවැරදි වැකිය ඇතුලත් කර contribute කරන්න.

මෙසේ නිවැරදි කරන විට අනිවාර්යෙන්ම අක්ෂර වින්‍යාසය සහ වියරණ සැලකිල්ලට ගන්න. එසේම ඉංගීසි ලිපියේ කාල භේදය සහ කර්මකාරක කතෘකාරක වැනි ස්වාරුපයන් එසේම සිංහල පරිවර්තනයට එන පරිදි පරිවර්තනය දෙන්න. ව්‍යාකරණ සහ අක්ෂර වින්‍යාස නොසලකා ගුගල් පරිවර්තකය වැඩි දියුණු කරන්න අපේ අය ගියොත් වන්නේ එහි නිවැරදි තාවය තවත් හීන වීමයි. එබැවින් එය කරන විට වගකීම් සහිතව කරන්න. දැනටම අපේ අය එහි මලපහ කර ඇති බව පෙනේ.

කෘතීම බුද්ධියක් රහිතව කවදාවත් පරිවර්තන කාර්යක් 100 % සාර්තක්කව යන්ත්‍රයකට කල නොහැක. දැනට එම ක්ෂේත්‍ර පරීක්ෂණ මට්ටමේ පවතී. ගුගල් පරිවර්තකය ක්‍රියාත්මක වන්නේ කෘතීම බුද්ධියට ආදාලම ක්ෂේත්‍රයක් වන machine learning ක්‍රමය යටතේය මෙහිදී යම් ඉංග්‍රීසි වාක්‍යකට ගැලපෙන සිංහල වාක්‍ය රටාව අඳුනා ගැනීම පුද්ගලයකුගේ පෙන්වා දීමකින් තොරව ඉබේ හඳුනා ගනු ලබයි. සිංහල සහ ඉංග්‍රීසි යනු වියරණ නීති වලින් දුරස්ථ භාෂා දෙකකි. සිංහල භාෂාවේ ඇති ලිංග භේදය, ගෞරවාර්ථ වාක්‍ය රටා. ඉංග්‍රීසිය තුල නැත. ඒවා අඳුනා ගැනීමට ගුගල් දැනට භාවිතා කරන ඇල්ගොරිතමය වලට පහසු නොවේ. වත්මන් ක්‍රමවේද යටතේ 100% තියා තේරුම අතින් 90% සහ වයාකරණ අතින් 70% වත් නිවැරදි තාවයක් බලාපොරෝහ්තු වීම විහිළුවකි. කෙසේ වුවත් ඒ මට්ටමට හෝ අපේ උනන්දුව මත ගත හැක. එසේ වුවහොත්. ඉන් ලබා ගන්නා දල පරිවාර්තනය මිනිස් සහය සහිහව වැඩි දියුණු කර වැඩි ලිපි ප්‍රමාණයක් පහසුවෙන් පරිවර්තනය සඳහා එය යොදා ගත හැක.

එසේම ගුගල් පරිවර්තකය තුල සැඟවුණු රාක්ෂයෙක් සිටී. එනම් දායක වන්නන්ගේ වගකීම් විරහිත ස්වභාවය  නිසා සහ ගුගල් පරිවර්තකයේ නොහැකියාව නිසා පිටවන වැරදි අක්ෂර වින්‍යාස සහ වයාකරණ නිසා සිංහල බසට වන හානියයි. මේ හානියට ගුගල් පරිවර්තකය මගින් වෙබ් අඩවියක් පරිවර්තනය කර එසැනින් බලා ගැනීමේ හැකියාව හේතු වේ. එබැවින් ඉගෙන ගන්න සිසුවෙක්  හෝ වෙනත් අයෙකුට  වැරදි වාක්‍ය රටා සහිත ලිපි විමර්ශනයක් රහිතව කියවා වැරදි වාක්‍ය රටා මනසට ගියවිට ඔහුටද වැරදි වාක්‍ය රටා නොදැනුවත්ව ලියවීමට හේතු වේ. එය බසට වන හානියකි.

මෙන්න ගුගල් පරිවර්තකයෙන් එන  විහිළු.
My sister in law is pregnant = නීතිය මගේ සහෝදරිය ගැබිනි වේ.
he wash his hand after going toilet = ඔහු වැසිකිළි යාමෙන් පසු ඔහුගේ අත සෝදන්න
i will fuck you = මම ඔයාට බැරිද ඇත
he is throwing rice to pigeons to eat = ඔහු කෑම කන්න පරෙවි සහල් වීසි කරයි
What makes a guy enjoy a female's company? = මොන ගයි කාන්තා මහතාගේ සමාගම භුක්ති වන්නේ කෙසේද?
We finished the test at the same time.= ඒ විධියට පරීක්ෂණ අවසන්.

Tuesday, December 16, 2014

හුරේ මෙවරත් අපිම තමයි එක (We are the first)


ලංකාව කියන්නේ ආසියාවේ ආශ්චර්යම තමයි. ඒ ගැන කිසිම සැකයක් නැහැ. නැත්නම් දැනට බලන්න පුළුවන් දත්ත අනුව පසුගිය වසර 4 දී  මේ අංශයෙන් ලෝකයෙන්ම එක වෙලා තියෙන්නේ අපේ අය. අපිව පරද්දන්න බංගලි කාරයෝ, ඉන්දියන් කාරයෝ, ඉතියෝපියන් කාරයෝ ලොකු ට්‍රයි එකක් ගත්තා මෙවරත් එත් අපි දිනුවා. මේ ජයග්‍රහණයට දායක වූ පාසල් හා විශ්ව විද්‍යාල සිසුන්, රාජ්‍ය හා පුද්ගලික අංශ සේවකයන්, විශ්‍රාමික පුද්ගලයන් ඇතුළු සැමට සුබපැතුම්.

කෝ කෝ තවම කියන්න බැරි වුනා නේ මේ ජයග්‍රහණය කුමන අංශයකින්ද කියලා. මෙවරත් අපි දිනුවේ ගුගල් වල sex සර්ච් කරලා. මෙන්න ජයග්‍රාහී රටවල්
google sex search 2014
ලොකු කරන්න ක්ලික් කරන්න

වෙන එකක් තබා අපි කොතරම් දියුණුද කියනවා නම් ජොබ් ගැන ගොසිප් ගැන සින්දු ගැන සොයනවාටත් වඩා අපි සෙක්ස් ගැන හොයනවා. මෙන්න දියුණුව
Compare Sex. Gossip, Jobs, Video, Songs
ලොකු කරන්න ක්ලික් කරන්න
එසේම ලෝකයේ පසුගිය වසරේදී වැඩිපුරම සොයන ලද වචනය facebook වේ. එම වචනය ලංකාවේදී sex වලට පරාජය වීමද තවත් ජයකි. එනම් අප සාමාන්යෙන් දන්නා පරිදි අපේ බොහෝ දෙනා facebook බාවිතා කරයි ලංකාවේ එයටත් වැඩි ප්‍රමාණයක් අන්තර්ජාලය මගින් සෙක්ස් සොයයි.



මෙහෙම උනත් ගිය වසර වල වගේම මේ වතාවෙත් තවත් වැදගත් අංශ වලින් ඉදිරියෙන් ඉන්නවා මෙන්න ගියවර ඒ ගැන මම විස්තර කල ලිපිය 

සොයා බැලීමට දත්ත පවතින පසුගිය වසර 10 සඳහා ගතහොත් සමස්තයක් ලෙස ඉදිරියෙන්ම සිටින්නේ අපි වේ. සමහර විට ලංකාවට ඉන්ටර්නෙට් ආ දවසේ සිට සිටින්නේද අපිම විය හැක. පසුගිය වසර 10 යේ දී අප පළමු 6 දෙනා අතර සිටීමද විශේෂත්වයකි

2004 - 6 වෙනියා
2005 - 4 වෙනියා
2006 - 4 වෙනියා
2007 - 5 වෙනියා
2008 - 3 වෙනියා
2009 - 5 වෙනියා
2010 - 4 වෙනියා
2011- 1 වෙනියා
2012- 1 වෙනියා
2013- 1 වෙනියා
2014- 1 වෙනියා

මේකත් තව ටික දවසකින් ගොසිප් කාරයෝ, පත්තර කාරයෝ පට්ට ගහන නිවුස් එකක් වේවි. ගුගල් සමාගමෙන් නිකුත් කල වාර්ෂික වාර්තාව අනුව මෙවරත් අපි සෙක්ස් වලින් එක කියලා. නමුත් මේ එහෙම වාර්තාවක් නොවේ. මේක පසුගිය කාලයේ මිනිසුන් ගුගල් හි සෙවුම් කලේ කෙසේද කියා බලා තම වෙබ් අඩවි සාර්ථක කරගැනීමට වෙබ් අඩවි හිමිකරුවන් සඳහා ඇති මෙවලමක්. ඕන වචනයකට ඇති ඉල්ලුම බලන්න මේකේ සර්ච් කර බලන්න
http://www.google.com/trends/

2014/12/15 දින පලකරන ලද ලිපියේ අඩුපාඩු කිහිපයක් තිබුණු බැවින් අද(2014/12/16) දින වැදගත් තව  කරුණු කිහිපයක් එක් කරන ලද බැවින් එයට පෙර කියවූ අය නැවත කියවා බලන්න.