Tuesday, August 29, 2006

Using Acopost as C library

Acopost is a collection of part-of-speech taggers written in C and Perl. However, AFAIK, Perl is used just for the code for training the tagger. According to the lastest version of Acopost, a tagger has be called by command line (unix shell). Since I want to call a part-of-speech tagging function from C code, Acopost must be transformed into a C library. Well, I can use system("t3 .....") but a tagger take quite long time for re-initialization. For convenient, GNU Building tools and pkg-config are used. Anyways, only the t3 tagger can be called from C.

The modified version can be download here.



Acopost เป็นชุดรวมโปรแกรมกำกับชนิดของคำที่เขียนด้วยภาษาซีและ Perl อย่างไรก็ตามเท่าที่ผมทราบ ภาษา perl ใช้เฉพาะใน code สำหรับฝึกฝนตัวกำกับชนิดของคำเท่านั้น ตามที่ดูจาก acopost รุ่นล่าสุด ตัวกำกับชนิดของคำต้องเรียกจาก command line (unix shell) เท่านั้น จากที่ผมต้องการจะเรียกตัวกำกับชนิดของคำจากภาษาซี ดังนั้น Acopost จึงสมควรจะถูกแปลงเป็น C library ถึงแม้ว่าเราจะใช้คำสั่ง system("t3 ....") ได้ แต่ว่า tagger ก็ใช้เวลานานในการเริ่มทำงานแต่ละครั้ง เพื่อความสะดวกในการแปลนี้ก็ได้ใช้ GNU Building tools และ pkg-config อย่างไรก็ตาม ตัวกำกับชนิดของคำ t3 เท่านั้นที่สามารถเรียกจากภาษาซีได้

รุ่นที่แก้ไขแล้วสามารถ โหลดได้ที่นี่.

No comments: