יום חמישי, 27 במאי 2010

איך מחסור בכלים לניתוח עברית בולם מיזמים בתחום השפה בארץ

כולם יודעים ששוק בישראל קטן וכל חברה שרוצה לשרוד חייבת להצליח בחו"ל. זה נכון גם בתעשיית השפה – אין מספיק צורך בתרגום מעברית או לעברית, אין מספיק אתרים בעברית ובסופו של דבר אין מספיק דוברי עברית. האם זה לא אומר שעדיף ליזמים להתמקד בשפות חשובות, כמו אנגלית, ספרדית או אפילו סינית. בהחלט! אז למה אני טוען שדווקא מחסור בכלים לניתוח עברית בולם מיזמים?

בואו נתחיל מהתחלה. מיזם נולד מרעיון, שמציע פתרון לבעיה קיימת או עונה לצורך מסוים. רעיון כזה לא נולד ככה סתם אצל כל אחד, אלא מתפרץ במוחו הקודח של אדם שחווה את הבעיה ומרגיש את הצורך על בסיס יום-יומי. כך למשל הרבה רעיונות על איך לשלב מחשב בתהליך התרגום הוצעו דווקא ע"י מתרגמים מקצועיים ולא ע"י אנשי מדעי המחשב. מרבית מיזמים חדשים הקשורים לתחום השפה מתמקדים באינטרנט (או אינטראנט) - סביבה גדושה באנשים ובאינפורמציה. ומי עומד מאחורי המיזמים האלה? אנשי המדיה והתוכן או אולי גולשים רגילים, שנדבקו בחיידק היזמות.

יום חמישי, 18 בפברואר 2010

חברות ישראליות בתעשיית השפה

כל תעשיה נבנית סביב צרכים שהיא מספקת. לדוגמא, תעשיית התקשורת מספקת ללקוחותיה העסקיים והפרטיים את הצורך לתקשר אחד עם השני באין ספור דרכים: תקשורת קווית, תקשורת אל-חוטית, אינטרנט מהיר וכו'. תעשיית השפה באה לספק צורך אפילו יותר בסיסי – לדעת ולהבין. מוצריה הבסיסיים הם חיפוש, תרגום ועיבוד מידע. בישראל פועלות עשרות חברות בתחום  כשכולן נלחמות על מקום קבע בתעשייה החדשה. 

חיפוש מידע

ענקי חיפוש כמו גוגל ויאהו שולטים בתחום החיפוש ביד רמה ומשאירים פירורים מבחינת נתח שוק לכל מי שמנסה להיכנס לתחום. בזירה הישראלית אפשר לציין את חברת Melingo ומנוע החיפוש שלה מורפיקס. החברה משווקת את מורפיקס כמנוע חיפוש חכם, בעל מודעות מורפולוגית, והמתקדם בעולם בשפות שמיות: עברית וערבית. עיקר הפעילות של החברה מתמקד בשיפור מנועי חיפוש ברשתות לוקליות והתאמתם לשפות בעלות מורפולוגיה עשירה, כגון עברית וערבית.  המודול של Melingo מקבל שאילתה לפני שנשלחה למנוע החיפוש, מנתח אותה מורפולוגית ומעצב אותה מחדש במטרה לשפר את תוצאות החיפוש. בין לקוחותיה של החברה  אפשר למצוא ענקית תוכנה Microsoft וחברות  גדולות נוספות. ל-Melingo יש גם יכולות תרגום מוגבלות, אך חינמיות (מורפיקס מילון): אלטרנטיבה נחמדה לבבילון, כשהוא אינו בהישג יד.

יום שני, 18 בינואר 2010

תרגום אוטומטי או הפירורים שגוגל משאירה לנו

כולם מכירים את שירות התרגום של גוגל. עכשיו כבר ברור כי ענקית החיפוש בדרך להשתלט על תחום התרגום באינטרנט. המתחרות שלה, כמו יאהו (עם Babel Fish) ומיקרוסופט (עם מנוע התרגום של Bing) אינן מצליחות להשיג אותה, בעיקר מבחינת מספר השפות הנתמכות. ואחת משלנו, Babylon, כל כך התאכזבה מביצועי מנוע התרגום שלה, שעכשיו היא מציעה שירותי תרגום אנושי. אני חייב לציין כי גם גוגל רחוקה מלהרשים, אך במרבית המקרים התרגומים מובנים לקורא ומצליחים להעביר את המשמעות של טקסט מקור. אגב, גם גוגל וגם מיקרוסופט תומכות בתרגום מעברית לאנגלית ומאנגלית לעברית.

יום שלישי, 29 בדצמבר 2009

מאקדמיה לתעשיה: יש למה לצפות אחרי התואר !?

לפני כשנה עזבתי את משרת ארכיטקט המבטיחה שהיתה לי בתעשיית התקשורת וחזרתי לאקדמיה לעשות תואר שלישי במדעי המחשב.  בחרתי להתמחות בבלשנות חישובית כהמשך למה שעשיתי בתואר שני, אך בניגוד מוחלט לנושאים בהם עסקתי בעשור ש"ביליתי" בתעשיה. ידעתי, שאני מכניס את עצמי לתוך נישה מאוד צרה ומקום עבודה בתחום לא מובטח לי כלל, ובכל זאת עשיתי את זה. למה? כי אני, אשר גדלתי בעולם קפיטליסטי מוקף במניות ואג"חים, מאמין בעקרון הסיכוי-סיכוי: תעשיית תקשורת הרוויה והמוגבלת על ידי אין ספור רגולטורים מאפשרת הרבה פחות הזדמנויות, מאשר תעשיית השפה מצפה להתגלות. אל תבינו אותי לא נכון - יש בי אהבה גדולה לתחום, זה פשוט לא הגורם המכריע.