יום שבת, 19 בספטמבר 2015

עברית קשה שפה גם ב-PDF

ניסיתם פעם להעתיק טקסט, פסקאות שלמות ממסמך בפורמט PDF?
אם ניסיתם סביר שלא הייתם מרוצים מהתוצאה התעצבנתם או עבדתם קשה על התיקון.

ניסיון להעביר את המסמך מ-PDF ל- WORD באמצעות תוכנת OCR נידון לכישלון ניסיתי במהלך השנים תוכנות שונות וכולן לא הצליחו להתמודד עם עברית. הטקסט מופיע הפוך, שילוב של אנגלית ועברית משגע אותן, גרפיקה גם מבלבלת אותן יישנן אותיות שמזוהות כאותיות אחרות.

המצב די דומה למה שמתרחש שמנסים להפוך טקסט בתמונה הנה דוגמה באמצעות אתר i2ocr


'יּי ' ןזיזהבּוּו הארץ
אי: כן ”ני י  הןיןייּ

טליה לביא קיןןתה שםרטה הראשון' ידבר אל הקהל הישראלי, אבל ﬠוד
לפני שיצא בארץ, זכה "אפס בירןסי אנוש" לפרסים בפסטיבל טרייבקה
היוקרתי ןברכש להפצה בינלאומית | שירןה ﬠם הבמאית ﬠל אבטלה סמויה,
דייט אלים והומןר שהןר

יְם ן
הגץבביקיןת המשןﬠממןת שכבש] את לב הצופים
האמריקאים

אהבתי יּ הגב יּ יפןחףהּשחפײ 2030 ה 9 >א19

הנה דוגמה להמרת טקסט
ןתכרעהל םיכרדו ןתרטמ ,הדימל תוירואית
הנבה ,הדימל לע םיעיפשמש םינתשמו םינונגנמ לש הכורא המישר ונרקס סרוקב וז הדוקנל דע קלחב .דמלל יאדכ ךיא – הארוה לע הלא םינתשמל שיש תוישעמה תוכלשהל ונסחייתהו ,ןורכיזו ,לשמל( הלאה תועפשהה תא םיריבסמש םייטרואית םילדומ םג םימייק םירקמהמ לודג
.)האלה ןכו ,דוביעה קמוע לדומ ,המכסה תיירואית המ לע ףיסוהל תולוכי ןה המ ?הדימל תוירואית – תופסונ תוירואיתב ךרוצ שי ,ןכ םא ,עודמ ?הכ דע ונדמלש

לאחר הפיכת הטקסט
תיאוריות למידה, מטרתן ודרכים להערכתן
גדול מהמקרים קיימים גם מודלים תיאורטיים שמסבירים את ההשפעות האלה (למשל, וזיכרון, והתייחסנו להשלכות המעשיות שיש למשתנים אלה על הוראה – איך כדאי ללמד. בחלק עד לנקודה זו בקורס סקרנו רשימה ארוכה של מנגנונים ומשתנים שמשפיעים על למידה, הבנה
שלמדנו עד כה? מדוע, אם כן, יש צורך בתיאוריות נוספות – תיאוריות למידה? מה הן יכולות להוסיף על מה תיאוריית הסכמה, מודל עומק העיבוד, וכן הלאה).

השוואה לטקסט שהועתק באמצעות העתק +הדבק

תיאוריות למידה, מטרתן ודרכים להערכתן
עד לנקודה זו בקורס סקרנו רשימה ארוכה של מנגנונים ומשתנים שמשפיעים על למידה, הבנה
וזיכרון, והתייחסנו להשלכות המעשיות שיש למשתנים אלה על הוראה – איך כדאי ללמד. בחלק
גדול מהמקרים קיימים גם מודלים תיאורטיים שמסבירים את ההשפעות האלה )למשל,
תיאוריית הסכמה, מודל עומק העיבוד, וכן הלאה(.
מדוע, אם כן, יש צורך בתיאוריות נוספות – תיאוריות למידה? מה הן יכולות להוסיף על מה
שלמדנו עד כה?

תוצאה זו די זהה למסמך PDF שנשמר כקובץ txt, יש להתחשב בכך שהמסמך נוצר ממסמך Word שנשמר כ- PDF ולכן ייתכן שאין בו בעיות רבות (למרות שכל הקטע המסומן בקו לא הומר בכלל). מסמך שנוצר מתוכנות הוצאה לאור דוגמת אינדזיין לא יעבור באופן פשוט כל כך ולא רק הסוגריים יוצגו לא נכון גם הפיסוק ייצמד למילה שבא לאחר סימן הפיסוק.

כך זה נראה בהעתקה ישירות מ- PDF לכאן:

לפני התחלת נסיעה, קרא את הוראות הפעלה
אלה. הדבר יעזור לך להפיק את מלוא ההנאה
מרכבך ולמנע לסכן את עצמך ואחרים.
מכיוון שאבזור הרכב מבוסס על הזמנת רכישת
הרכב, הציוד ברכבך עשוי להיות שונה בתיאורים
ואיורים מסוימים. גם פריטים של ציוד אופציונלי
מתוארים בהוראות הפעלה אלה, במידה ותרצה
תיאור של הדרך בה הם פועלים.

אך כך זה ייראה בהעתקה למסמך Word כאשר הפיסוק לא נמצא המקום הנכון גם לאחר ניקוי עיצוב:

הפתרון הוא להעביר אותו דרך תוכנית חסרת כל עיצוב פנקס רשימות (Notepad) ומשם להעתיק אותו ל- Word ואז הוא יועתק כמו שהועתק לכאן.


יום שישי, 24 ביולי 2015

מה לעשות בקוד QR?

לכאורה מדובר בשאלה די טיפשית ברור לנו מה ניתן לעשות בקוד QR - לצור קישור לכתובת אינטרנט שאפשר לקרוא אותה מסמארטפון. הכתובת יכולה להיות כל קישור לדף אינטרנט ובכלל זה תמונה או כתובת דואר אלקטרוני.

שימוש ראשון שניתן לעשות בו למשל באתר אינטרנט לשים קוד QR ליצירת קשר, לדף הקשר או לכתובת דוא"ל בשני המקרים הטלפון יתנהג באופן שונה (אני משער כך לא ביצעתי בדיקה מדוקדקת): 
  • אם מדובר בדף צור קשר של האתר הוא יפתח אותו בדפדפן.
  • אם מדובר בכתובת דואר אלקטרוני הוא יפתח את תוכנת הדוא"ל.
שימוש שני לשים אותו על כרטיס ביקור.
במקרה זה במקום לצלם או לסרוק את כל הכרטיס הוא סורק רק את קוד QR, שיכול להיות תמונה של הכרטיס או פשוט כתובת דוא"ל של בעל הכרטיס.

אלו שימושים שאנשים ודאי חשבו עליהם וכבר ראיתי קודי QR על כרטיסי ביקור.
אבל עלה לי רעיון מדוע לא להביא את הקדמה למקום אחר.
שמחירי הסמארטפונים יורדים לרבים (או לרובם) יש יכולת לסרוק קוד QR.
למה לא לצרף בתחתית הזמנה לאירוע קישור למפה או לStreet view או לתמונה של מקום אם ישנה.
ב-Google maps מתחת ללוויין יש תפריט נפתח וניתן לבקש להציג תמונות שמשתמשים צילמו והעלו ל-Panoramio (שירות תמונות שגוגל רכשה לפני מספר שנים) .

הכתובת מסומנת בראש סיכה אדום בלחיצה ימנית בעכבר אנו מקבלים את האפשרות לקבל הנחיות להגעה (Directions) אם נבחר את זה נקבל ראש סיכה ירוק ואם נבצע גם עליו לחיצה ימנית ונבחר SEND נקבל חלונית של התוכן שיישלח לא נלחץ על שלח אלא נעתיק את הכתובת הארוכה ונשתמש בה ליצירת קוד QR.

מדוע לא ביצעתי Send מראש הסיכה האדום?! כיוון שאז מופיעה מפה מוקטנת. אם אצור מהכתובת שלה קוד QR הוא יהיה לפיסה מהמפה שבה נמצא היעד, בעוד שמראש הסיכה הירוק קוד QR יוביל למפה ב-Google maps המשתמש יוכל לבקש הנחיות ולראות את הסביבה ודרכי ההגעה.

ראיתי בספר רכב דף שלם שהוא קודי QR שהם קישור לסרטון הדרכה ביוטיוב.
זה אומר שאם יש לך מספר סרטוני הדרכה אתה יכול לצמצם אותם לדף אחד של קודי QR שיהיו נגישים לטלפון סלולרי.

ישנם הרבה אתרים ליצירת קודי QR הבולטים הם Google URL Shortner  ו- bitly. כמובן יתרונם בכך שיש להם יכולת סטטיסטיקה על הצפייה בקוד.

סקירה טובה על מקצרי URL תוכלו למצוא באתר של ענבר יסעור

עוד דוגמאות למה ניתן לעשות עם קוד QR
25 Fun Ways to use QR Codes

מה זה קוד QR?

מה אפשר לעשות עם קוד QR?

יום שישי, 19 ביוני 2015

עוד שגיאה ועוד שגיאה...


עדיין מספר רב של אנשים אינם מבינים מדוע צריך לשלם על תרגום טוב. כדי להראות לכם אם מה מתרגם צריך להתמודד אביא לכם מספר דוגמאות ממסמך אחד (שמחבריו ומוצאו יישארו עלומים).

Inspiration and adjustment after starting engine
מתברר שמנוע יכול לעורר השראה, אבל למעשה זה צריך להיות inspection בדיקה 

Gradeability
מה שרוצים לומר כאן הוא למעשה maximum climbing grade (כושר/יכולת טיפוס) במונח אכן נעשה שימוש בטיפוס צוקים אבל הוא לא נמדד במעלות כי אם בציון מילולי: קל, מתון, קשה וכו'.

hang the low gear and pull up the parking brake
למה לתלות? איפה נמצאת ידית ההילוכים?

You will have a hangover with luxury and safety
כאן רצו לומר שמבחר האבזור יגרום לך לשיכרון חושים, אבל כנראה שהחמרמורת פגעה בשיקול הדעת של הכותב.

used to realize the on and off of driver fun
באוטובוס יש לנהג בין מניין אוהדים במיניבוס עד עשרות באוטובוסים גדולים (מזכיר את השיר "הנהג שלנו חברמן"). המשמעות אגב היא הפעלת המאוורר של הנהג. ובמסמך זה לעתים קרובות לצורך הפעלה משתמשים בפועל realize.

spectacular will be heated electrically and be defrosted
מדובר במראה החיצונית של הרכב והכוונה הייתה ל- spectacle שזו בחירה גרועה במינוח.

 Hosting control panel of player
לא מדובר במשהו שקשור בשרתי מחשב, אלא בלוח הבקרה של נגן המדיה

screw off the oil tank cover, and insert the fuel gun into the fuel filler.
כידוע שמן באנגלית הוא גם נפט (petroleum), אבל כיוון שבמכונית יש חומרי סיכה המכונים שמן זה לא רק אינו נכון אלא גם מטעה להשתמש במינוח זה.

During high-speed traveling or on the descending slope road, the vehicle braking shall be controlled with predictability.
האהבה של הכותב לתוארי הפועל (adverb) מביאה לניסוחים מסורבלים, אני הייתי מציע "לנהוג באופן המאפשר לחזות סכנות מראש" "תוך שימת לב לסכנות אפשריות", ובקיצור לפשט את המשפט.

gas exchange function shall be used frequently when the temperature is not too high
מדובר כאן במחזור אוויר ולמרות שאוויר הוא הוא תערובת של גזים, עדיף לא לסמוך על הידע של הנהג במדעים.

The electrical box is located in the electric device compartment at the top of the middle part of left luggage compartment.
מינוח מסובך שפשוט רוצה לומר תיבת נתיכים.

When the luggage compartment floor is covered with floor leather and
תא מטען יוקרתי? האמת לא כל כך. מתברר שבשפתו של הכותב, כמו בעברית אין הבדל בין עור כחלק מיצור חי וכאשר הוא חומר גלם, לכן העור כאן הוא פשוט חומר פלסטי שמצפה את רצפת תא המטען.

Used to control the fur wind modes of air
האם לרוחות יש פרווה? לא, פשוט ניתן לכוון את פתחי האוורור לארבעה מצבים.

ובמסמך אחר יש מונח מטעה על אף שאינו שגוי ויש שמכנים חלק זה בשם זה.
Access panel
אם אומר לכם שמדובר בטנדר גם אז תתקשו לדעת מה זה מדובר בקבינה וחצי, כלומר תא נהג שמאחוריו יש מושבים והם נגישים באמצעות חצי דלת שניתן לפתחה שדלת הנהג פתוחה, כמו שרואים בתמונה למטה.


יום שלישי, 30 בספטמבר 2014

מי זה?

להלן סרטון Youtube שמטרתו לצאת נגד האמירה "כמו בחורה" (Like A Girl).


הסרטון הופק באופן מקצועי ובעל מסר חינוכי אבל מי הפיק אותו?
פעמיים מופיעה המילה ALWAYS וזה גם הגורם שהעלה את הסרטון, כפי שניתן לראות אם עוברים ל-Youtube.

מה שמעניין הוא שהגופן (פונט) שנבחר יש לו מראה מיוחד משהו כזה:

נראה מוכר לכם (בעיקר לכן)

המממנת היא אולוויז מותג הגיינת וטואלטיקת נשים של תאגיד פרוקטר אנד גמבל (P&G).
ניתן לראות זאת בחדשות באתר פרוקטור אנד גמבל (קישור ישיר).

מדובר בתופעה נפוצה של חברות שמבינות שהן צריכות לתרום לחברה ולא רק לקחת מאנשים. חברה אשר מרוויחה מנשים ומעודדת העצמה נשית מייצרת לעצמה תדמית חיובית. תדמית חיובית לחברה פירושה תדמית חיובית למוצרים. זהו צעד לגיטימי ביחסי ציבור ואפילו מבורך. קידום העצמה נשיית נעשה לא רק על-ידי חברות שהעסק שלהם בנוי על הכנסות מנשים.
הנה דוגמה של סרטון של חברה סלולרית אמריקאית, ווריזון:



אבל מה זה קשור למידע.
החברות האלו בכוונה לא דוחפות את השם שלהם עם בולדוזר, כי זה היה מזיק למסר וזה היה מתקבל כצדקנות - "תראו כמה אנחנו נחמדים תומכים במטרות חברתיות ושוויון".

פה מדובר במטרות טובות ולכן אין לא משנה אם פספסנו את המסר הסמוי שחברה מסחרית עומדת מאחורי הסרטון.
השאלה מה קורה שהמסר אינו תמים?

יום ראשון, 3 באוגוסט 2014

כיצד לצרף תמונות לסטטוס או לציוץ בלי לשמרן

זוכרים שפעם ניתן היה להכניס תמונה מהאינטרנט לפייסבוק, אבל כיום בפייסבוק וגם בטוויטר ניתן רק להעלות תמונות המחשב. אז זה לא מדויק, מבחינת מחשב אין הבדל אם אתם אומרים לו לקחת תמונה מהמחשב או מהרשת שתיהן נמצאות על מחשב (שלכם או על שרת אינטרנט) ויש להם נתיב (Path). זה בדיוק כמו כונן (דיסק) קשיח וירטואלי שיש לחלקנו למשל: Drive או OneDrive או Dropbox שמתפקדים כאילו הם כונן על המחשב.

שהסמן על התמונה ניתן מהתפריט שנפתח בלחיצה ימנית של העכבר להעתיק את כתובת התמונה או לפתוח אותה בכרטיסייה חדשה, או בחיפוש תמונה ללחוץ על View image.

אני אדגים הוספה לפייסבוק של התמונה הבאה


הנמצאת בכתובת:
http://f.nanafiles.co.il//Upload/122011/Software/facebook-logo-1.jpg

התהליך לטוויטר הוא די דומה.

לוחצים על סמל הוספת תמונה


נפתחת התיבה הזו

בשדה שכתוב בו שם קובץ או File name מדביקים את כתובת האתר של התמונה מהאינטרנט.


לוחצים Open והתמונה נכנסת לסטטוס או לציוץ שלכם כאילו עלתה מהמחשב שלכם.

יום חמישי, 19 ביוני 2014

מוות וחיים ביד הלשון

ענב גנד גלילי הגישה תביעת לשון הרע נגד 26 גופים ואישים ביניהם התוכנית "צינור לילה", המגיש שלה גיא לרר ומספר בלוגרים, שפרסמו ביקורת נגדה שלדעתה מהווה לשון הרע. (ראו וואלה  כלכליסט)

בסוף 2013 ענב גנד גלילי, המציגה עצמה כמומחית DEEP WEB, נתנה הרצאה במסגרת איגוד האינטרנט הישראלי. כיוון שההרצאות של איגוד האינטרנט הישראלי מוקלטות ומועלות לרשת, לא עבר זמן רב ואנשים החלו לבקר את ההרצאה שלטענתם רצופה בשגיאות ובטעויות ואף בחוסר ידע הגובל בשרלטנות. (רוב מאמרי הביקורת על ההרצאה הורדו כנראה תחת איום בתביעה שינו מאמר אחד של אורי הוך בלינמגזין (נכון לעכשיו)).

בעקבות התביעה הושק קמפיין למימון ההגנה של הנתבעים באתר הדסטארט שהשיג את יעד הגיוס הראשוני שלו.

אם הם צודקים כיצד נוכל לסמוך על המידע שאנו מקבלים?

חשבתם פעם מדוע תוכניות מצלמה נסתרת מצליחות.
הסיבה שמוחנו מקבל מידע הוא מחשיב אותו לאמת, אלא אם מתברר לו אחרת. מידע הנאמר על-ידי בעל סמכות באופן משכנע ייתפס כאמיתי.
מדוע?!
חישבו על האפשרות האחרת נפקפק בכל מידע. לא נוכל לבטוח באף אחד. ההתנהגות שלנו תהיה פרנואידית, כי אם אין לבטוח באף אדם, הרי ייתכן שיש אנשים הזוממים נגדך.

לפני מספר שנים קראתי דוגמה מעניינת: להקת חיל האוויר נסעה להופעה ונתקעה בפקק. יצא מישהו מהלהקה והחל לכוון את התנועה שחרר את הפקק והם נסעו לדרכם.

הביטו בתצלום להקת חיל האוויר ונסו לנחש למה זה קרה.


התשובה כמובן שמדי ייצוג של חיל האוויר נראים כמו מדי שוטר. אם מישהו במדי שוטר מכוון את התנועה (וגם עושה זאת באופן סביר) מדוע לחשוד בו!

ענב גנד גלילי מציגה את עצמה כמומחית בתחום הרשת העמוקה, היא רואיינה בערוץ 2 בנושא זה, היא מרצה לפני ארגונים ציבוריים בנושא זה, היא מופיעה באירוע של איגוד האינטרנט הישראלי. מדוע שנפקפק בדבריה לפני ששמענו אותה וכאשר יש גורמים ציבוריים שנראה מכירים במומחיותה.

כיצד נוכל לדעת שהדברים נכונים אם האדם נראה אמין?!
ראשית יש קישורים לפרופיל החברתי של ענב גנד גלילי (לפחות חלקו) בתחתית הפוסט.

עלי פי השכלתה מאמרים ופוסטים שהיא כתבה נראה שמומחיותה בניהול ואסטרטגיה, עדיין העובדה שמישהו לא למד מקצוע אינו אומר שלא יכול להבין בנושא, אך זו בעייה באישוש האמינות.

ההרצאה הורדה מאיגוד האינטרנט אבל נמצאת ביוטיוב בציון השגיאות ויש לה קישורים מאינטרנט ישראל. (יש גם פירוט יפה מיהו מומחה?)

שנית, אף שאיני טוען למומחיות בתחום, ישנן שתי טעויות שצוינו שעשתה ענב גנד גלילי שמראות על רשלנות או בורות או שתיהן.


  1. התמונה כפי שציינו אחרים היא מזוייפת ואם תחפשו אותה ב- Google Images אכן תמצאו שמקורה באתר הומוריסטי של מתכנתים, גם קריאה של הטקסט מעידה על כך שהוא מגוחך.
  2. מריאנה על-פי גנד גלילי הוא שם ספרדי. נכון אבל כאן אירע פספוס גדול. מריאנה הוא שמה של מלכת ספרד. איי מריאנה באוקינוס השקט נקראים על שמה ועד מלחמת ספרד ארה"ב נשלטו על-ידי ספרד. אבל הקשר של מריאנה לרשת העמוקה היא "תהום מריאנה" הנמצאת ליד האיים, המקום העמוק ביותר בעולם כ-11,000 מטרים מתחת לפני הים.

העובדה שענב גנד גלילי בחרה לספק הסבר למשהו שהיא לא יודעת וניתן לברר תוך דקה באינטרנט מטילה ספק במומחיותה או במקצועיותה.

לסיום אביא את קטע הסיום מתוך מאמר "כיצד עובדת הרשת העמוקה" מאתר HOWSTUFFWORKS שלפי רשימת המקורות נראה רציני.

הרשת העמוקה היא מקום מעורפל, שאינו חד משמעי. אבל ניתן היה להסיק בבירור לפחות דבר אחד - רוב כותרות חדשות נוטות לייצר סנסציה מהרשת האפלה והצדדים הפחות טובים שלה, ורק לעתים רחוקות מזכירות את הפוטנציאל הגלום ברשת העמוקה. מאמרים על סמים ונשק בלתי חוקיים, ודאי מושכים יותר קוראים מאשר אלו המפרטים את האתגרים הטכניים של כריית נתונים מהרשת העמוקה. הטילו ספק כאשר אתם קראו את המאמרים השליליים, חסרי הנשמה האלו. ראוי לזכור שהרשת העמוקה היא הרבה יותר מאשר האלמנט הפלילי המובן מאליו. כמו שמהנדסים מנסים למצוא דרכים טובות יותר, מהירות יותר לקטלוג  של מאגרי הנתונים של הרשת. האינטרנט בכללותו יכול לשנות את החברה שלנו באופנים מפליאים.
זה מזכיר לנו שתמיד צריך לבדוק כי שפע המידע נוצר בחלקו על-ידי אנשים שלא מיומנים או שמתרשלים.
ונקווה שלא נצטרך בסוף כל בלוג לכתוב בעו"דית:
"אין לראות בנאמר לעיל משום המלצה או קריאה לביצוע. הדברים שנאמרו לעיל נכתבו כל סמך מידע שהיה מצוי בידי הכותב בעת הכתיבה. אין כותב אחראי לכל טעות, שגיאה או ליקוי שנפל במידע בין שנעשה בזדון או ברשלנות שלא יכול היה הכותב להיות מודע לו בעת הפרסום וגו'"

הפרופיל של ענב גנד (גוטשל) גלילי ברשת
http://il.linkedin.com/in/enavgenadgalili
http://cafe.themarker.com/user/164971/
https://www.facebook.com/enav.galili

יום ראשון, 25 במאי 2014

מי הבקיע למי?

במבזק החדשות המסכם של יום שבת בערוץ 1 דווח: "התוצאה כרגע במשחק גביע האלופות היא 2:1", הפוגה קצרה ולאחר מכן "למדריד".

במשחק ניצחה ריאל מדריד את אתלטיקו מדריד 1:4.

כנראה כבר הבחנתם בבעיה המילה מדריד לא מוסרת לנו שום מידע, אלא אולי סתם מתסכלת כי נתנו לנו למעשה מידע חסר ערך.

מי שנתן את המידע למבזקנית כנראה לא חשב מספיק.

אבל לא יצאנו בלי כלום, לפחות נודע לנו שזה באצטדיון האור בפורטוגל.

אין צורך לקפוץ ולהאשים את ערוץ 1, למרבה הצער גם בערוצים אחרים זה יכול לקרות (וגם קורה).