Claude Code נגמר מהר? 7 טריקים שחוסכים 70% טוקנים

המנוי נגמר אחרי 3 שיחות? הבעיה היא לא התוכנית. הבעיה היא שאתם שולחים את הדגם היקר לעשות עבודה של מתמחה.

שלושה ימים לתוך המנוי, וכבר נגמרו הטוקנים.

מכירים את זה? שילמתם $20 על Claude Pro, פתחתם Claude Code, עשיתם שלוש שיחות ופתאום הודעה: "You've reached your usage limit."

אתם לא לבד. בפורום הרשמי של Anthropic יש מאות תלונות על בדיוק את זה. משתמשים מדווחים שהמנוי נשרף פי 4 יותר מהר ממה שהם ציפו.

אבל הבעיה היא לא Anthropic. הבעיה היא שאתם שולחים את הפרופסור לקנות חלב.

בואו נסביר.

1. תבינו מה בעצם עולה כסף

Claude Code עובד עם שלושה דגמים. כל אחד עולה אחרת:

דגם	עלות קלט	עלות פלט	מתי להשתמש
Haiku	$1 למיליון טוקנים	$5	משימות פשוטות, שאלות מהירות
Sonnet	$3 למיליון טוקנים	$15	כתיבה, עריכה, בנייה
Opus	$5 למיליון טוקנים	$25	ניתוח מורכב, ארכיטקטורה

מה זה אומר בפועל? Opus שורף טוקנים פי 5 יותר מהר מ Sonnet. ו Haiku? שליש מהעלות של Sonnet.

רוב האנשים עובדים עם Opus כל הזמן. זה כמו לקחת מונית מהסלון למטבח.

💡 הכלל: Opus רק כשצריך לחשוב קשה. לכל השאר? Sonnet או Haiku.

2. החליפו דגם באמצע השיחה

הנה הטריק שרוב האנשים לא מכירים. אתם לא חייבים לסגור ולפתוח מחדש.

/model haiku

זהו. מילה אחת. מעכשיו כל מה שתשאלו ילך ל Haiku, הדגם הזול.

צריכים לחזור ל Opus?

/model opus

ויש גם קיצור מקלדת: Option + P פותח תפריט בחירת דגם בלי להקליד כלום.

הנוסחה שלי: מתחילים כל סשן ב Sonnet. עוברים ל Opus רק כשצריכים ניתוח עמוק או רפקטורינג מורכב. ולמשימות כמו "תשנה את השם של המשתנה הזה" או "תוסיף שורה פה"? Haiku. תמיד Haiku.

אם אתם חדשים ב Claude Code, המדריך למתחילים יעזור לכם להתחיל נכון.

3. תנקו את ההקשר (Context)

כל הודעה שאתם שולחים ל Claude Code נושאת איתה את כל ההיסטוריה של השיחה. כל שאלה, כל תשובה, כל קובץ שנקרא.

חלון ההקשר הוא 200,000 טוקנים. נשמע הרבה, אבל סשן דיבאגינג אחד יכול לשרוף 50,000 טוקנים בקלות.

שתי פקודות שחייבים להכיר:

/compact

דוחס את כל השיחה לסיכום קצר. שומר על מה שחשוב, זורק את השאר. החיסכון? עד 60% מהטוקנים בכל הודעה שאחרי.

/clear

מתחיל מאפס. שיחה חדשה, חלון נקי. עדיף לפתוח שיחה חדשה עם פרומפט טוב מאשר לגרור סשן ארוך עם 50 תיקונים.

⚠️ טיפ חשוב: /compact נדלק אוטומטית כשמגיעים ל 95% מהחלון. אבל אל תחכו. הריצו אותו כל 15 דקות בסשנים ארוכים.

4. תפסיקו להאכיל אותו קבצים מיותרים

Claude Code קורא ומאנדקס קבצים שאף פעם לא ביקשתם ממנו לקרוא. node_modules, קבצי build, lock files. כל אחד מהם שורף טוקנים על קריאה.

הפתרון: קובץ .claudeignore בתיקיית הפרויקט. עובד בדיוק כמו .gitignore:

node_modules/
dist/
build/
*.lock
.next/
coverage/

עוד טריק: ה CLAUDE.md שלכם? כל מילה שם נטענת בכל סשן. אם הוא 200 שורות, זה מאות טוקנים שנשרפים לפני שבכלל התחלתם לעבוד. תקראו את המדריך על הגדרת Claude Code ותלמדו לשמור אותו רזה. מקסימום 60 שורות.

5. תכתבו פרומפטים חכמים (לא ארוכים)

בקשה אחת ארוכה ומפורטת שורפת פחות טוקנים מחמש בקשות קצרות.

למה? כי כל הודעה שולחת מחדש את כל ההיסטוריה. חמש הודעות = חמש פעמים שההקשר נטען.

במקום:

"תתקן את הבאג"
"אה, שכחתי, גם תוסיף לוג"
"ותשנה את השם של הפונקציה"
"חכה, גם תעדכן את הטסטים"

כתבו:

"תתקן את הבאג בפונקציה X, תוסיף console.log לפני הקריאה ל API, תשנה את שם הפונקציה ל handleUserInput, ותעדכן את הטסטים בהתאם"

בקשה אחת. ארבע פעולות. חיסכון של 75% בטוקנים.

💡 טיפ בונוס: השתמשו בפקודה /cost כדי לראות בזמן אמת כמה טוקנים שרפתם בסשן הנוכחי.

6. קבצי הקשר גדולים? הם אוכלים לכם קרדיטים בשקט

הנה משהו שרוב האנשים לא מבינים.

יש לכם קובץ CLAUDE.md עם הוראות לפרויקט? קבצי זהות? קבצי "נשמה" לסוכן? כל פעם שהאיג'נט עובד, כל הקונטקסט הזה נטען מחדש. כל הודעה. כל פעולה.

אם שמתם 500 שורות של הוראות בקבצי ההקשר, זה יכול להיות 5,000 עד 10,000 טוקנים שנשרפים על כל אינטראקציה בודדת. לפני שהאיג'נט בכלל התחיל לחשוב על הבקשה שלכם.

עשו חשבון: 50 הודעות ביום כפול 8,000 טוקנים של הקשר = 400,000 טוקנים שהלכו רק על טעינת הוראות. זה כמעט פי 10 מהמכסה היומית של Pro.

מה לעשות:

שמרו רק את מה שחייבים בקובץ CLAUDE.md הראשי
העבירו מידע ספציפי לקבצי memory שנטענים רק כשצריך
אל תשימו היסטוריה, לוגים, או דוקומנטציה שלמה בקבצי ההקשר
כלל אצבע: אם האיג'נט לא צריך את המידע ב 80% מהשיחות, הוא לא צריך להיות בקובץ הראשי

⚠️ הכלל הכי חשוב: כל שורה בקובץ הקשר = טוקנים שנשרפים בכל הודעה. תחשבו על זה כמו חשבון חשמל שרץ ברקע.

7. תבנו Skills ו Pipelines במקום לחזור על עצמכם

שאלה שעולה הרבה: אפשר ליצור דברים מותאמים אישית ב Claude Code?

התשובה: כן. ויש שלושה כלים:

Skills (מיומנויות)
קובץ markdown עם הוראות שמופעל עם פקודת slash. למשל /my-skill. במקום להסביר לאיג'נט מאפס מה אתם רוצים בכל פעם, כותבים את ההוראות פעם אחת ומפעילים עם פקודה.

החיסכון? במקום 200 טוקנים של הסבר בכל שיחה, פקודה של 3 מילים.

Pipelines (צינורות עבודה)
שרשרת של שלבים שרצים אחד אחרי השני. למשל: מחקר → כתיבה → עריכה → פרסום. כל שלב מקבל את הפלט של הקודם. אתם מגדירים את זה פעם אחת, ומפעילים עם פקודה אחת.

Agents (סוכנים מקבילים)
סשנים נפרדים שרצים במקביל על worktrees שונים. כל אחד עובד על משימה שלו, בלי לשרוף את ההקשר של השני. אחד כותב קוד, אחד כותב טסטים, אחד כותב דוקומנטציה. שלושה סשנים, שליש מהטוקנים לכל אחד.

💡 טיפ: Skills ו Pipelines נשמרים כקבצי markdown בתיקיית .claude/skills/. אם אתם חדשים, תתחילו מהמדריך ליצירת פקודה מותאמת.

צ'קליסט: חיסכון טוקנים ב Claude Code

שנו את דגם ברירת המחדל ל Sonnet (לא Opus)
השתמשו ב /model haiku למשימות פשוטות
הריצו /compact כל 15 דקות בסשנים ארוכים
צרו קובץ .claudeignore בכל פרויקט
שמרו את ה CLAUDE.md מתחת ל 60 שורות
העבירו קונטקסט כבד לקבצי memory נפרדים
איחדו בקשות קטנות לבקשה אחת גדולה
בנו Skills למשימות שחוזרות על עצמן
בדקו עלויות עם /cost

שאלות נפוצות

למה Claude Code נגמר כל כך מהר?

ברירת המחדל של Claude Code היא לעבוד עם Opus, הדגם היקר ביותר. בנוסף, כל הודעה שולחת את כל ההיסטוריה של השיחה. בלי ניהול הקשר (compact/clear), סשן של 30 דקות יכול לשרוף את כל המכסה היומית.

מה ההבדל בין /compact ל /clear?

/compact דוחס את השיחה לסיכום. אתם לא מאבדים הקשר. /clear מוחק הכל ומתחיל מאפס. השתמשו ב compact כשאתם באמצע משימה, ו clear כשאתם עוברים למשימה חדשה לגמרי.

האם Haiku מספיק טוב לכתיבת קוד?

לשינויים קטנים, שינוי שמות משתנים, הוספת שורות, תיקוני syntax? בהחלט. Haiku מגיע לרמת ביצועים דומה ל Sonnet במשימות ישירות, בשליש מהעלות.

כמה טוקנים יש למנוי Pro?

למנוי Pro יש בערך 44,000 טוקנים לכל חלון של 5 שעות. Max5 מקבל 88,000, ו Max20 מקבל 220,000. עם הטריקים במדריך הזה, 44,000 יספיקו ליום עבודה שלם.

קבצי הקשר גדולים שורפים טוקנים?

כן, וזה הדבר הכי מפתיע. כל קובץ שנטען אוטומטית (CLAUDE.md, קבצי זהות, קבצי נשמה) נשלח מחדש עם כל הודעה. אם יש לכם 500 שורות של הוראות, זה אלפי טוקנים שנשרפים על כל אינטראקציה. תשמרו אותם רזים ותעבירו מידע משני לקבצים נפרדים.

אפשר ליצור Skills ו Pipelines מותאמים?

בהחלט. Skills הם קבצי markdown בתיקיית .claude/skills/ שמופעלים עם פקודת slash. Pipelines הם שרשרת שלבים. Agents הם סשנים מקבילים ב worktrees נפרדים. מודלים אי אפשר ליצור, אבל אפשר לבחור בין Haiku, Sonnet ו Opus ולהחליף ביניהם באמצע סשן.

אפשר לראות כמה טוקנים נשארו?

כן. הריצו /cost בתוך Claude Code כדי לראות את הצריכה של הסשן הנוכחי. ואם אתם רוצים מעקב קבוע, הפקודה /statusline מציגה שורת סטטוס בתחתית הטרמינל עם אחוז ניצול חלון ההקשר בזמן אמת.

רוצים ללמוד עוד על Claude Code? בחרו פרויקט ראשון מהמדריכים שלנו ותתחילו לבנות.

הירשמו לניוזלטר שלנו כדי לקבל טיפים כאלה ישירות למייל, כל שבוע.