Tag: תיכנות
OCR בעזרת רשת עצבית בJavaScript
by Fate on ינו.08, 2009, under כללי
כן כן, שמעתם טוב…
מכירים את האתר Megaupload?
זה כמו Rapidshare, אבל עם CAPTCHA הרבה יותר פשוטה של 3 אותיות.
מי שלא מכיר את הCAPTCHA, הנה לינק לדוגמה להורדה: http://www.megaupload.com/?d=X03HFLP1
(מצד ימין יש 3 אותיות)
כולם יודעים שCAPTCHA נועדה למנוע רובוטים שינסו להוריד את הקובץ בצורה אוטומטית,
וחלק אפילו יודעים שיש אפשרות לנסות לעשות זיהוי Optical Character Recognition או בקצרה OCR.
אבל אני לא חושב שמישהו פה ראה סקריפט Javascript שמממש את זה,
ואפשר להשתמש בו Live מול האתר בעזרת Add-on לFirefox שקוראים לו Greasemonkey.
התוסף מאפשר הרצת סקריפטים מסויימים עבור אתר כשנכנסים אליו.
הלינק הקודם שהבאתי, (http://www.megaupload.com/?d=X03HFLP1)
מכיל הורדה של התוסף, וגם של הסקריפט שעושה זיהוי אוטמטי עם הCAPTCHA של Megaupload.
מי שלא מעניין אותו השלמה אוטמטית של הCAPTCHA לפחות יעניין אותו איך בנוי הסקריפט.
הסקריפט מממש רשת עצבית מלאכותית ומגיע עם המשקלים המתאימים כדי לזהות את הCAPTCHA.
מי שמעניין אותו לקרוא על Artificial Neural Networks מוזמן ללמוד על זה מ:
http://en.wikipedia.org/wiki/Artificial_neural_network
הנה חלק מהסקריפט עם כמה מהמשקלים:
function create_net() { //pre-calculated weights var h_weights = [[-0.126359597761, [-0.58837191446576764, 0.036755965405260743 , 0.51854514831840781, -0.43431581850621709, 1.0754289255168701 , -0.64799960752449348, 1.1940698464323356, -0.86824098689125395 , 0.29366831980315877, -0.89830849234532661, -0.43654295013922195