How I wrote a Tamil essay using Machine language

Ever wondered how your mobile keyboard suggests you the next word you are going to type?

WhatsApp Image 2017-04-13 at 2.51.39 PM

The answer is machine learning. Your mobile learns from the previous words you have typed in and predicts the next word you are going to type.

Now assume you have a book of text. And your program has learned from it. You type in “I am” and the program knows what word is the next probable one.

Taking it to the next level, you can guess the next word in a book. What if you start from a sentence and ask the machine to guess every other word. The machine ends up writing its own novel. Thats what I have tried here using torch-rnn. This library helps to create a recurrent neural network which learns the text you pass to it.

In this case I used சிவகாமியின் சபதம் an awesome tamil novel. I was able to get the text from Project Madurai. So to simplify the steps.

  1. Choose a good amount of training data set for the program to study.
  2. Run the train command for the program to learn.
  3. Provide a sample and let the program generate the essay for you.

For the training data set, I tried multiple books. The first book I used was around 60 pages and the results weren’t so great. The program was not able to generate any meaningful text. I played around with increasing the size of the training data to end up with sivagaminyin sabatham.

Training the data is time and memory cumbersome. It took me few hours to train the data in a 16GB, quad core processor. That was a problem because to test each dataset I had to wait so long.

So this is the end result from the program.

ொஜயன்பதாக விசையாகக் காணவில்லை. அங்கிருந்து கிட்டு தடவை
சுகந்தனை பரவண வாய்ந்து அப்பேர் அவள் ஒருவேளை ஏதோ என் தங்கச் சிலாதாபிச் சாத்துவித்திருக்கோம். என்னிடம் வேண்டும்; ‘ஜிவகாபன குதி சுரப்பக்கிற்று. அந்த வாரியில் இருந்தது. மற்ற வடிவமாக வௌியேறினார்.
“பல்லவ வீரர்கள் கற்புக்களின் மௌனமாயிருந்தது. களவுகள் உயலிலேதான் நிழல்கூட மகன் பேச்சைக் கண்டாய், பயன்மாம், இலண்ணீர், எனக்குள்ளம் செய்து கொள்ள விருங்க ஏறின. மகள் அது என்னைப் பார்ப்பானா? என்ன அந்த ஆறையிலே ஒத்துவிட வேண்டும் ‘துரவுக்கரசர் ஒரு பாட்டினங்’ ஒருவாறு சிவகாமி, “சிவகாமி! வாலையைப் பார்க்க வேண்டியதில்லை; அந்தப் நம்பித்துவிடல் அப்படியும் வடநிலைகளை நாட்டின. கவனிழ் ஒரு நுழைந்தார்கள். “சத்ருக்னனுக்குத் தெரிந்து கொண்டுவையும், இப்படி என்பதை அடைந்து பிரதியாது. அதோ சொல்லி நின்றாள். தகவினான், சற்று உடச்சித்து வர முடியுமா

ஆனால் சொல்லியிருக்கிறது பல்லவ இராஜ்யத்தில் போன முக்கிய துவாபித்தது. தோப்பாடர்கள் மாமல்லரை முடித்த திறந்து விட்டவண்ணே! என்னை?” என்று தங்களுக்கு முன்னால் தங்கக் காடனே துடித்துக் கொண்டு வந்த பிறகு, பாவித்தார்கள். அப்பனே! அரண்மனை செய்ததும் கண்ட உணர்ச்சி கேட்டுத் தூர்த்து மயில்’ என்ற நாகநந்தி சப்தம், தமிழ் ஒருகொள்கிறார்!” என்றான் கள்ளவர் கம்புக் கலங்க வாஷலுக்கு ஏற்படலாய்ப் போவது போல் தொடங்கினார்கள். இர்ந்தாய் அன்று விதமானது பிடித்துக் கொண்டிருக்கக் கச்சிக்கு உறுதியைக் குறித்தபடியே வந்திருந்த எங்களிடம் கம்பாஷங்களை தெரிந்திருந்த போதும், கலைத்துக் கொண்டு போனதாயிற்று, அவசரமாகவில்லை. சிறிது நல்லுவேன்” என்றார் பைத்தியமாய் விட்டு இம்மாதிரி காலையிற்று.
வரவிலும் தடத்தியமாய் ஒரு நிசித்திரன் குகைப் புதல்வன் புரியும். அந்தச் கோவர் கோபம் சிவகாமி காற்றில் புலகத்துடன் தழுத்தேன் என்று உபகாரிக்க முடியவில்லை. அதற்கு நான் புலிகே அந்தபட்ட என்ன இராஜ்யத்தில் போய்ப் பெண் பேசி மலர் நீ இன்னும் தான் பேசிக் கொண்டிருந்தால், நீ! மறந்தோ தெரிந்து கொண்டிருப்பது போர் மின்னல் மண்டலங்களும் அவளுக்கு என்ன வேலை செய்தி அறைவிலும் அச்சமயம் குதிரைத்தான். ஆம்! இந்தப் பேச காலமும் சிவகாமி தடைப்பட்ட மன்னிப்பில் வந்தால் தன்னைச் சிலாசாஙி, சக்கரவர்த்தி என் தமதி சொன்னார்… இந்தப் பெரும் நினைத்து இப்போது ஏகாம்பரம் பிடித்து நின்றார்கள். அந்தக் காட்டின்தான், காஞ்சிக்கும

HTML list with Tamil numbers

Its possible to use pure css to get HTML ordered lists in Tamil.

ol {
    list-style-type: -moz-tamil;
    list-style-type: tamil;
}

You can use ol html tag and list-style-type css property to make list with Tamil numbers. Works on Mozilla Firefox only as of now. Chrome supports other regional Indian languages, hope Tamil is also supported soon.

How I translated Wallch to Tamil

Wallch is a Ubuntu app which allows your desktop wallpaper to change automatically.

There was an invitation to translate it into any language of your choice here 

I just wanted to give a shot. So translated the app into Tamil and have mailed the developers and am waiting for a reply.

It’s simple to translate any app into other languages if planned well. This app uses Qt linguist to translate the app. I used google translate from English to Tamil.

Enhanced by Zemanta