התקשרו אלינו: 052-2928949
ימים א'-ה' בין השעות 9:00-17:00

התקשרו אלינו: 052-2928949 א-ה 9:00-17:00

איתור קבצים כפולים בעזרת Power Query

Power Query

איתור קבצים כפולים בעזרת Power Query

Power Query

פתיח – ובו הודעה מפחידה…

ככה פתאום, בלי שום התרעה, קיבלתי הודעה שהדרייב שלי מלא.
זה קרה אחרי שקניתי מחשב חדש והייתי צריכה להגדיר את התיקיות לסנכרון.
מכיוון שעל הדרייב אני שומרת את כל המידע, ובלעדיו העסק שלי עלול לקרוס,
לקחתי לעצמי רבע שעה להלחץ ואז…

פרק שני – התעשתות

מכיוון שידעתי בוודאות שיש לי עוד המון מקום, תיארתי לעצמי שכנראה, בטעות, גררתי לשם פעמיים את אותה התיקיה (או התיקיות…)
המחשבה הראשונה שלי היתה לחפש אפליקציה כלשהי שיודעת למצוא קבצים כפולים,
אבל אז נזכרתי שלא לחינם אני מומחית אקסל (:
רוצים לדעת איך פתרתי את הבעיה?
בקלות, ובלי שורת קוד VBA אחת…
והסוד?
Power Query כמובן

פרק שלישי – הפתרון

את הפתרון אפרק לכם לשלבי העבודה, כדי שיהיה לכם יותר קל לעקוב

שלב ראשון – טעינת נתונים מתיקיה

מתפריט 'נתונים' בחרתי ב'יבא נתונים' > 'מקובץ' > 'מתיקיה'

קבצים מתיקיה

שלב שני – ניווט אל הדרייב

בחרתי בתיקיה שאותה רציתי לבדוק

טעינה מתיקיה
ולחצתי על 'המרת נתונים'
קיבלתי רשימה של כל הקבצים שקיימים בכונן

שלב שלישי – הוספת גודל הקובץ

מכיוון שגודל הקובץ לא מופיע באופן אוטומטי, לחצתי על שני החיצים תחת Attributes, וקיבלתי את רשימת השדות,
מתוכם בחרתי להוסיף את שדה הגודל (Size)

גודל קובץ

שלב רביעי – איחוד שדות ליצירת מזהה חד חד ערכי

מכיוון שיכולים להיות קבצים בעלי שם זהה, ששמורים בתיקיות שונות, אך אין בהם את אותו התוכן, ולכן הם לא קבצים כפולים,
רציתי ליצור שדה שמאחד את עמודת שם הקובץ, הסיומת, תאריך היצירה והגודל לשדה אחד,
מתוך הבנה שאם ארבעת הפרמטרים האלה זהים, מדובר באותו הקובץ,
ואת זה עשיתי על ידי סימון העמודות הרצויות, ובכרטיסיית 'המר' בחרתי ב'מזג עמודות'
ניתן כמובן למזג גם בכרטיסיית 'הוסף עמודה'. במקרה הזה – העמודות המקוריות ישמרו, ותיווצר עמודה מאוחדת חדשה.

שלב חמישי – מיון

כעת ביקשתי ביקשתי למיין את הטבלה על פי גודל הקובץ בסדר יורד,
כדי שיהיה לי קל יותר לאתר את הקבצים הגדולים, שתופסים הרבה מקום.

שלב שישי – השארת כפילויות

מכיוון שאני לא מעוניינת ברשימה של כל הקבצים, אלא בקבצים הכפולים בלבד,
סימנתי את העמודה שאיחדתי, עברתי לכרטיסיית 'בית' > 'השאר שורות' > 'השאר כפילויות'

השארת כפילויות

וזהו, כל מה שנשאר לי לעשות זה לטעון את הטבלה אל האקסל, ולבדוק את הקבצים.
מדי פעם רעננתי את הטבלה, כדי לראות כמה מקום גוזלים הקבצים הכפולים,
ומכיוון שהתחלתי עם הקבצים הגדולים, המקום התפנה במהירות,
והדרייב שלי הפסיק לשלוח לי מיילים יומיומיים בבקשה לנקות אותו (:

מעוניינים ללמוד לעבוד עם הכלי בקלות?

בדיוק בשביל זה כתבתי עבורכם את הספר
“Power Query – הכלי האולטימטיבי ליצירה ולעיבוד מידע”

לפרטים ורכישה, לחצו על תמונת הספר

דילוג לתוכן