יום שבת, 19 בספטמבר 2015

עברית קשה שפה גם ב-PDF

ניסיתם פעם להעתיק טקסט, פסקאות שלמות ממסמך בפורמט PDF?
אם ניסיתם סביר שלא הייתם מרוצים מהתוצאה התעצבנתם או עבדתם קשה על התיקון.

ניסיון להעביר את המסמך מ-PDF ל- WORD באמצעות תוכנת OCR נידון לכישלון ניסיתי במהלך השנים תוכנות שונות וכולן לא הצליחו להתמודד עם עברית. הטקסט מופיע הפוך, שילוב של אנגלית ועברית משגע אותן, גרפיקה גם מבלבלת אותן יישנן אותיות שמזוהות כאותיות אחרות.

המצב די דומה למה שמתרחש שמנסים להפוך טקסט בתמונה הנה דוגמה באמצעות אתר i2ocr


'יּי ' ןזיזהבּוּו הארץ
אי: כן ”ני י  הןיןייּ

טליה לביא קיןןתה שםרטה הראשון' ידבר אל הקהל הישראלי, אבל ﬠוד
לפני שיצא בארץ, זכה "אפס בירןסי אנוש" לפרסים בפסטיבל טרייבקה
היוקרתי ןברכש להפצה בינלאומית | שירןה ﬠם הבמאית ﬠל אבטלה סמויה,
דייט אלים והומןר שהןר

יְם ן
הגץבביקיןת המשןﬠממןת שכבש] את לב הצופים
האמריקאים

אהבתי יּ הגב יּ יפןחףהּשחפײ 2030 ה 9 >א19

הנה דוגמה להמרת טקסט
ןתכרעהל םיכרדו ןתרטמ ,הדימל תוירואית
הנבה ,הדימל לע םיעיפשמש םינתשמו םינונגנמ לש הכורא המישר ונרקס סרוקב וז הדוקנל דע קלחב .דמלל יאדכ ךיא – הארוה לע הלא םינתשמל שיש תוישעמה תוכלשהל ונסחייתהו ,ןורכיזו ,לשמל( הלאה תועפשהה תא םיריבסמש םייטרואית םילדומ םג םימייק םירקמהמ לודג
.)האלה ןכו ,דוביעה קמוע לדומ ,המכסה תיירואית המ לע ףיסוהל תולוכי ןה המ ?הדימל תוירואית – תופסונ תוירואיתב ךרוצ שי ,ןכ םא ,עודמ ?הכ דע ונדמלש

לאחר הפיכת הטקסט
תיאוריות למידה, מטרתן ודרכים להערכתן
גדול מהמקרים קיימים גם מודלים תיאורטיים שמסבירים את ההשפעות האלה (למשל, וזיכרון, והתייחסנו להשלכות המעשיות שיש למשתנים אלה על הוראה – איך כדאי ללמד. בחלק עד לנקודה זו בקורס סקרנו רשימה ארוכה של מנגנונים ומשתנים שמשפיעים על למידה, הבנה
שלמדנו עד כה? מדוע, אם כן, יש צורך בתיאוריות נוספות – תיאוריות למידה? מה הן יכולות להוסיף על מה תיאוריית הסכמה, מודל עומק העיבוד, וכן הלאה).

השוואה לטקסט שהועתק באמצעות העתק +הדבק

תיאוריות למידה, מטרתן ודרכים להערכתן
עד לנקודה זו בקורס סקרנו רשימה ארוכה של מנגנונים ומשתנים שמשפיעים על למידה, הבנה
וזיכרון, והתייחסנו להשלכות המעשיות שיש למשתנים אלה על הוראה – איך כדאי ללמד. בחלק
גדול מהמקרים קיימים גם מודלים תיאורטיים שמסבירים את ההשפעות האלה )למשל,
תיאוריית הסכמה, מודל עומק העיבוד, וכן הלאה(.
מדוע, אם כן, יש צורך בתיאוריות נוספות – תיאוריות למידה? מה הן יכולות להוסיף על מה
שלמדנו עד כה?

תוצאה זו די זהה למסמך PDF שנשמר כקובץ txt, יש להתחשב בכך שהמסמך נוצר ממסמך Word שנשמר כ- PDF ולכן ייתכן שאין בו בעיות רבות (למרות שכל הקטע המסומן בקו לא הומר בכלל). מסמך שנוצר מתוכנות הוצאה לאור דוגמת אינדזיין לא יעבור באופן פשוט כל כך ולא רק הסוגריים יוצגו לא נכון גם הפיסוק ייצמד למילה שבא לאחר סימן הפיסוק.

כך זה נראה בהעתקה ישירות מ- PDF לכאן:

לפני התחלת נסיעה, קרא את הוראות הפעלה
אלה. הדבר יעזור לך להפיק את מלוא ההנאה
מרכבך ולמנע לסכן את עצמך ואחרים.
מכיוון שאבזור הרכב מבוסס על הזמנת רכישת
הרכב, הציוד ברכבך עשוי להיות שונה בתיאורים
ואיורים מסוימים. גם פריטים של ציוד אופציונלי
מתוארים בהוראות הפעלה אלה, במידה ותרצה
תיאור של הדרך בה הם פועלים.

אך כך זה ייראה בהעתקה למסמך Word כאשר הפיסוק לא נמצא המקום הנכון גם לאחר ניקוי עיצוב:

הפתרון הוא להעביר אותו דרך תוכנית חסרת כל עיצוב פנקס רשימות (Notepad) ומשם להעתיק אותו ל- Word ואז הוא יועתק כמו שהועתק לכאן.


יום שישי, 24 ביולי 2015

מה לעשות בקוד QR?

לכאורה מדובר בשאלה די טיפשית ברור לנו מה ניתן לעשות בקוד QR - לצור קישור לכתובת אינטרנט שאפשר לקרוא אותה מסמארטפון. הכתובת יכולה להיות כל קישור לדף אינטרנט ובכלל זה תמונה או כתובת דואר אלקטרוני.
(אזהרה: גם גורמים זדוניים המשתמשים בקוד QR לפישינג או להפצת תוכנות זדוניות יודעים זאת לכן יש לסרוק רק קוד QR שאתם בטוחים במקורו)

שימוש ראשון שניתן לעשות בו למשל באתר אינטרנט לשים קוד QR ליצירת קשר, לדף הקשר או לכתובת דוא"ל בשני המקרים הטלפון יתנהג באופן שונה (אני משער כך לא ביצעתי בדיקה מדוקדקת): 
  • אם מדובר בדף צור קשר של האתר הוא יפתח אותו בדפדפן.
  • אם מדובר בכתובת דואר אלקטרוני הוא יפתח את תוכנת הדוא"ל.
שימוש שני לשים אותו על כרטיס ביקור.
במקרה זה במקום לצלם או לסרוק את כל הכרטיס הוא סורק רק את קוד QR, שיכול להיות תמונה של הכרטיס או פשוט כתובת דוא"ל של בעל הכרטיס.

אלו שימושים שאנשים ודאי חשבו עליהם וכבר ראיתי קודי QR על כרטיסי ביקור.
אבל עלה לי רעיון מדוע לא להביא את הקדמה למקום אחר.
שמחירי הסמארטפונים יורדים לרבים (או לרובם) יש יכולת לסרוק קוד QR.
למה לא לצרף בתחתית הזמנה לאירוע קישור למפה או לStreet view או לתמונה של מקום אם ישנה.
ב-Google maps מתחת ללוויין יש תפריט נפתח וניתן לבקש להציג תמונות שמשתמשים צילמו והעלו ל-Panoramio (שירות תמונות שגוגל רכשה לפני מספר שנים) .

הכתובת מסומנת בראש סיכה אדום בלחיצה ימנית בעכבר אנו מקבלים את האפשרות לקבל הנחיות להגעה (Directions) אם נבחר את זה נקבל ראש סיכה ירוק ואם נבצע גם עליו לחיצה ימנית ונבחר SEND נקבל חלונית של התוכן שיישלח לא נלחץ על שלח אלא נעתיק את הכתובת הארוכה ונשתמש בה ליצירת קוד QR.

מדוע לא ביצעתי Send מראש הסיכה האדום?! כיוון שאז מופיעה מפה מוקטנת. אם אצור מהכתובת שלה קוד QR הוא יהיה לפיסה מהמפה שבה נמצא היעד, בעוד שמראש הסיכה הירוק קוד QR יוביל למפה ב-Google maps המשתמש יוכל לבקש הנחיות ולראות את הסביבה ודרכי ההגעה.

ראיתי בספר רכב דף שלם שהוא קודי QR שהם קישור לסרטון הדרכה ביוטיוב.
זה אומר שאם יש לך מספר סרטוני הדרכה אתה יכול לצמצם אותם לדף אחד של קודי QR שיהיו נגישים לטלפון סלולרי.

ישנם הרבה אתרים ליצירת קודי QR הבולטים הם Google URL Shortner  ו- bitly. כמובן יתרונם בכך שיש להם יכולת סטטיסטיקה על הצפייה בקוד.

סקירה טובה על מקצרי URL תוכלו למצוא באתר של ענבר יסעור

עוד דוגמאות למה ניתן לעשות עם קוד QR
25 Fun Ways to use QR Codes

מה זה קוד QR?

האם קודי QR בטוחים (אנגלית)
לסיום, מומלץ תמיד ללחוץ רק על קישורים שאתם בטוחים במקורם וזה כולל קוד QR.

יום שישי, 19 ביוני 2015

עוד שגיאה ועוד שגיאה...


עדיין מספר רב של אנשים אינם מבינים מדוע צריך לשלם על תרגום טוב. כדי להראות לכם אם מה מתרגם צריך להתמודד אביא לכם מספר דוגמאות ממסמך אחד (שמחבריו ומוצאו יישארו עלומים).

Inspiration and adjustment after starting engine
מתברר שמנוע יכול לעורר השראה, אבל למעשה זה צריך להיות inspection בדיקה 

Gradeability
מה שרוצים לומר כאן הוא למעשה maximum climbing grade (כושר/יכולת טיפוס) במונח אכן נעשה שימוש בטיפוס צוקים אבל הוא לא נמדד במעלות כי אם בציון מילולי: קל, מתון, קשה וכו'.

hang the low gear and pull up the parking brake
למה לתלות? איפה נמצאת ידית ההילוכים?

You will have a hangover with luxury and safety
כאן רצו לומר שמבחר האבזור יגרום לך לשיכרון חושים, אבל כנראה שהחמרמורת פגעה בשיקול הדעת של הכותב.

used to realize the on and off of driver fun
באוטובוס יש לנהג בין מניין אוהדים במיניבוס עד עשרות באוטובוסים גדולים (מזכיר את השיר "הנהג שלנו חברמן"). המשמעות אגב היא הפעלת המאוורר של הנהג. ובמסמך זה לעתים קרובות לצורך הפעלה משתמשים בפועל realize.

spectacular will be heated electrically and be defrosted
מדובר במראה החיצונית של הרכב והכוונה הייתה ל- spectacle שזו בחירה גרועה במינוח.

 Hosting control panel of player
לא מדובר במשהו שקשור בשרתי מחשב, אלא בלוח הבקרה של נגן המדיה

screw off the oil tank cover, and insert the fuel gun into the fuel filler.
כידוע שמן באנגלית הוא גם נפט (petroleum), אבל כיוון שבמכונית יש חומרי סיכה המכונים שמן זה לא רק אינו נכון אלא גם מטעה להשתמש במינוח זה.

During high-speed traveling or on the descending slope road, the vehicle braking shall be controlled with predictability.
האהבה של הכותב לתוארי הפועל (adverb) מביאה לניסוחים מסורבלים, אני הייתי מציע "לנהוג באופן המאפשר לחזות סכנות מראש" "תוך שימת לב לסכנות אפשריות", ובקיצור לפשט את המשפט.

gas exchange function shall be used frequently when the temperature is not too high
מדובר כאן במחזור אוויר ולמרות שאוויר הוא הוא תערובת של גזים, עדיף לא לסמוך על הידע של הנהג במדעים.

The electrical box is located in the electric device compartment at the top of the middle part of left luggage compartment.
מינוח מסובך שפשוט רוצה לומר תיבת נתיכים.

When the luggage compartment floor is covered with floor leather and
תא מטען יוקרתי? האמת לא כל כך. מתברר שבשפתו של הכותב, כמו בעברית אין הבדל בין עור כחלק מיצור חי וכאשר הוא חומר גלם, לכן העור כאן הוא פשוט חומר פלסטי שמצפה את רצפת תא המטען.

Used to control the fur wind modes of air
האם לרוחות יש פרווה? לא, פשוט ניתן לכוון את פתחי האוורור לארבעה מצבים.

ובמסמך אחר יש מונח מטעה על אף שאינו שגוי ויש שמכנים חלק זה בשם זה.
Access panel
אם אומר לכם שמדובר בטנדר גם אז תתקשו לדעת מה זה מדובר בקבינה וחצי, כלומר תא נהג שמאחוריו יש מושבים והם נגישים באמצעות חצי דלת שניתן לפתחה שדלת הנהג פתוחה, כמו שרואים בתמונה למטה.