X
  • שנהיה בקשר?
    כל שאלה או בקשה תתקבל בברכה

    שדות המסומנים ב * הינם שדות חובה

האם נתוני ה-Data Studio
וה-Spreadsheet שלי מסומפלים?

אם אתם משתמשים בגוגל אנליטיקס, אתם בטח יודעים לזהות אם המידע בכל מסך הוא מלא או מסומפל. אבל איך תדעו מה מצב הסימפול בכלים אחרים? והאם יש דרך לעקוף את הסימפול?
התראות ישירות לתיבת המייל שלך
על כל מה שחדש בעולם הדיגיטל?
  • שדה זה הינו למטרות אימות וצריך להישאר ללא שינויים.

כמעט כל מי שעובד עם גוגל אנליטיקס מכיר את סמל המגן שנמצא מעל הגרף בדוחות השונים. סמל זה מספר לנו האם הדאטה שבדו"ח בו אנו צופים מסומפלת – האם התצוגה כוללת 100% מהנתונים האמיתיים, או שהמערכת מציגה לנו הערכות על בסיס נתונים חלקיים. כידוע, מגן ירוק מעיד שהדו"ח מציג נתונים מלאים, ואילו מגן צהוב מסמן שהדאטה שמולנו מסומפלת, ולכן יש לגשת אליה בזהירות המתבקשת.

עד כאן לגבי התצוגה בתוך ממשק גוגל אנליטיקס. אבל הרבה פעמים אנחנו ניגשים לנתונים דרך Data Studio או Spreadsheets, ובהם לא ברור באופן מיידי האם הנתונים מאנליטיקס מסומפלים. במאמר זה אלמד כיצד לזהות דאטה מסומפלת בספרדשיט ובדאטה סטודיו, אשתף אתכם בטיפ שיכול לעזור במניעת טעויות ואסיים בטריק שיעזור לכם לעקוף סימפול של דאטה באמצעות שימוש בספרד שיט.

איך עובד הסימפול בדאטה סטודיו, וכיצד נזהה אותו?

הסמפלינג בדאטה סטודיו עובד לפי אותם כללים של אנליטיקס – אם הדו"ח שאתם מריצים מסומפל באנליטיקס, סביר להניח שגם בדאטה סטודיו הנתונים שתקבלו יהיו מסומפלים. אבל איך אפשר לבדוק האם הדשבורד שלנו מכיל מידע מסומפל?

מתחת לכל דשבורד בדאטה סטודיו, בפינה הימנית, כתוב מתי הנתונים בדשבורד התעדכנו בפעם האחרונה. אם הדו"ח מכיל נתונים מסומפלים, ליד תאיך העדכון יופיע גם Show Sampling (מסומן בצהוב בתמונה >>).

לחיצה על Show Sampling תציג את אחוזי הסימפול עבור כל גרף – וכאן נמצא אחד המאפיינים הבולטים של דאטה סטודיו. בשונה מאנליטיקס בו כל מסך הינו דו"ח, דאטה סטודיו הינו כלי ליצירת דשבורדים, וכל טבלה או גרף בדשבורד מהווים למעשה דו"ח בפני עצמו. לכן יתכן מצב שבו גרף אחד יהיה עם אחוזי סימפול שונים מגרף אחר, או שבאותו דשבורד חלק מהגרפים יכילו דאטה מסומפלת וחלק דאטה לא מסומפלת.

איך עובד הסימפול בספרדשיט, וכיצד נזהה אותו?

בדומה לדו"חות האנליטיקס, גם בספרדשיט ניתן לשלוט במידה מסוימת על רמת הסימפול ולהחליט האם נעדיף עיבוד מהיר ודאטה מסומפלת יותר, או עיבוד איטי ודאטה מלאה יותר. על מנת להגדיר זאת ניגש לטאב Report Configuration, דרכו מגדירים את הדו"חות ב- add-on של אנליטיקס בספרדשיט, ונרד לשורה 13 – Sampling Level. עבור כל עמודה נוכל לבחור ב-"faster" לעיבוד מהיר יותר או ב- higher_precision לרמת דיוק גבוהה יותר. ישנה גם אפשרות לכתוב "default" עבור ברירת המחדל, אבל אין צורך בכך מכיוון שאם נשאיר את התא ריק אפשרות זו תבחר באופן אוטומטי.

כמו בדאטה סטודיו, גם בספרדשיט כל עמודה יוצרת דו"ח נפרד בטאב נפרד, וייתכנו הבדלים ברמת הסימפול בין טאב לטאב. על מנת לבדוק האם הדאטה בדו"ח מסויים מסומפלת או לא ניגש לתא B6 ונבדוק אם כתוב Contains Sampled Data, Yes או No. במידה והדאטה מסומפלת, תאים B7 ו-B8 יציגו לנו את מספר הביקורים עליהם מבוסס הדו"ח ואת אחוז הדגימה.

דוח

 

טיפ

על מנת לבדוק בקלות שכל הדו"חות עודכנו ואינם מכילים דאטה מסומפלת, מומלץ לייצר טאב בקרה שימשוך את ערכי התאים A1, B2 ו-B6 מכל אחד מהדו"חות, כך שתתקבל טבלה שתיראה כך:

טבלה

 

אז מה הטריק שמאפשר לעקוף את הסימפול דרך ספרדשיט?

בגלל שכל עמודה בטאב Report Configuration מייצרת למעשה דו"ח נפרד, אם הגורם לסימפול הוא הרצון להסתכל על דאטה מתקופה ארוכה, נוכל לייצר עמודות זהות שלכל אחת מהן נגדיר טווח זמן קצר שלא גורם לסימפול. לאחר מכן נפתח טאב נוסף ונסכום את התוצאות מהטאבים השונים.

אם הדו"חות מתבססים על מימדים (dimensions) עם ערכים קבועים, למשל Device Category, נוכל להגדיר ב-Report Configuration שהעמודות יסודרו לפי מימד זה. במידה ומודבר במימד עם ערכים משתנים כמו Source / Medium, נוכל להיעזר בנוסחת vlookup או ב-pivot table.