230 likes | 332 Views
Principy překladačů. Vysokoúrovňové optimalizace Jakub Yaghob. Optimalizace. Ideální případ – generovaný kód je stejně dobrý jako ručně psaný Platí to dnes ještě? Skutečnost Pouze v několika vymezených situacích Obtížné Optimalizace Transformace programu
E N D
Principy překladačů Vysokoúrovňové optimalizace Jakub Yaghob
Optimalizace • Ideální případ – generovaný kód je stejně dobrý jako ručně psaný • Platí to dnes ještě? • Skutečnost • Pouze v několika vymezených situacích • Obtížné • Optimalizace • Transformace programu • Na rychlost nebo na velikost kódu • Vysokoúrovňové optimalizace • Prováděné nad mezikódem
Kritéria pro transformace • Zachování smyslu programu • Výstup a chování programu nesmí být transformací změněny • Zrychlení o měřitelnou velikost • Obvykle transformace zvyšující rychlost • Někdy optimalizace zpomalí, i když v průměrném případě zrychluje • Transformace musí být hodna vynaložené námaze • Složitá/pomalá optimalizace s malým zrychlením není moc užitečná
Druhy optimalizací • V rámci jednoho základního bloku • Nejsou žádné skoky • V rámci jedné funkce • Pohyb kódu mezi bloky • Vznikají, zanikají základní bloky • V rámci celého programu (interprocedurální) • Zrychlení volání mezi funkcemi • Provádí se ve fázi linkování zpožděným překladem
Organizace optimalizátoru • Analýza toku řízení • Konstrukce grafu toku řízení • Analýza toku dat • Výpočet životnosti proměnných Front end Optimalizátorkódu Generátorkódu Analýzatoku řízení Analýzatoku dat Transformace
Lokální optimalizace • V rámci jednoho základního bloku • Eliminace společného podvýrazu (common subexpression elimination) • Propagování kopií (copy propagation) • Eliminace mrtvého kódu (dead-code elimination) • x = y+z, a x již není nikde dál použitá • Výpočet konstantních výrazů (constant folding) • Algebraické transformace • x = x + 0, x = x * 1
a = b + c b = a – d c = b + c d = a – d a = b + c b = a – d c = b + c d = b Lokální eliminace společného podvýrazu • Je tady schovaný problém • Pointer aliasing • ap = &a • b = a + c • *ap = d • e = a + c
Analýza toku dat • „Obarvení“ uzlů grafu toku řízení (základních bloků) proměnnými, které jsou v tomto uzlu živé • Nemusí být živé v celém základním bloku • Uvnitř základního bloku se dopočítá přesná životnost • Výpočet pořadí vyhodnocení • Topologické setřídění DAGu, který popisuje definici proměnné jako cíl hran uzlů použitých pro výpočet • Modelování ukazatelů • Pointer aliasing • Modelování volání funkcí • Interprocedurální optimalizace
Globální optimalizace • Více základních bloků, možný pohyb kódu mezi bloky, příp. i změna grafu toku řízení • Eliminace společného podvýrazu (common subexpression elimination) • Propagování kopií (copy propagation) • Eliminace mrtvého kódu (dead-code elimination) • Optimalizace cyklů • Přesun invariantního kódu • Redukce síly operace • Odstranění indukční proměnné
while(i<limit-5) S t = limit – 5; while(i<t) S Optimalizace cyklů – 1 • Přesun invariantního kódu • Výpočet, který se v cyklu nemění se předpočítá před cyklem
Optimalizace cyklů – 2 • Redukce síly operace • Typicky operace násobení převedená na sčítání • Odstranění indukční proměnné • Stačí pouze jediná indukční proměnná cyklu • Obvykle se podaří zrušit při redukci for(i=3;i<8;i+=3) { j = i*2; a[j] = j; } for(t=6;t<16;t+=6) a[t] = t;
Příklad – kód v C i=m-1; j=n; v=a[n]; for(;;) { do ++i; while(a[i]<v); do --j; while(a[j]>v); if(i>=j) break; x=a[i]; a[i]=a[j]; a[j]=x; } x=a[i]; a[i]=a[n]; a[n]=x;
i = m-1 j = n t1 = 4*n v = a[t1] i = i+1 t2 = 4*i t3 = a[t2] if t3<v goto 5 j = j-1 t4 = 4*j t5 = a[t4] if t5>v goto 9 if i>=j goto 23 t6 = 4*i x = a[t6] t7 = 4*i t8 = 4*j t9 = a[t8] a[t7] = t9 t10 = 4*j Příklad – tříadresový kód • a[t10] = x • goto 5 • t11 = 4*i • x = a[t11] • t12 = 4*i • t13 = 4*n • t14 = a[t13] • a[t12] = t14 • t15 = 4*n • a[t15] = x
Příklad – graf toku řízení B4 B1 i = m-1 j = n t1 = 4*n v = a[t1] if i>=j goto B6 B5 B6 t6 = 4*i x = a[t6] t7 = 4*i t8 = 4*j t9 = a[t8] a[t7] = t9 t10 = 4*j a[t10] = x goto B2 t11 = 4*i x = a[t11] t12 = 4*i t13 = 4*n t14 = a[t13] a[t12] = t14 t15 = 4*n a[t15] = x B2 i = i+1 t2 = 4*i t3 = a[t2] if t3<v goto B2 B3 j = j-1 t4 = 4*j t5 = a[t4] if t5>v goto B3
Příklad - LCSE B5 B5 t6 = 4*i x = a[t6] t7 = 4*i t8 = 4*j t9 = a[t8] a[t7] = t9 t10 = 4*j a[t10] = x goto B2 t6 = 4*i x = a[t6] t8 = 4*j t9 = a[t8] a[t6] = t9 a[t8] = x goto B2
Příklad – GCSE B4 B1 i = m-1 j = n t1 = 4*n v = a[t1] if i>=j goto B6 B5 B6 x = t3 a[t2] = t5 a[t4] = x goto B2 x = t3 t14 = a[t1] a[t2] = t14 a[t1] = x B2 i = i+1 t2 = 4*i t3 = a[t2] if t3<v goto B2 B3 j = j-1 t4 = 4*j t5 = a[t4] if t5>v goto B3
Příklad – copy propagation a dead-code elimination B5 B5 x = t3 a[t2] = t5 a[t4] = x goto B2 x = t3 a[t2] = t5 a[t4] = t3 goto B2 B5 B5 x = t3 a[t2] = t5 a[t4] = t3 goto B2 a[t2] = t5 a[t4] = t3 goto B2
Příklad – redukce síly operace B1 B1 i = m-1 j = n t1 = 4*n v = a[t1] i = m-1 j = n t1 = 4*n v = a[t1] t4 = 4*j B2 B2 B3 B3 j = j-1 t4 = 4*j t5 = a[t4] if t5>v goto B3 j = j-1 t4 = t4-4 t5 = a[t4] if t5>v goto B3 B4 B4 if i>=j goto B6 if i>=j goto B6 B5 B6 B5 B6
Příklad – odstranění indukční proměnné B1 B1 i = m-1 j = n t1 = 4*n v = a[t1] t4 = 4*j i = m-1 j = n t1 = 4*n v = a[t1] t4 = 4*j B2 B2 B3 B3 j = j-1 t4 = t4-4 t5 = a[t4] if t5>v goto B3 t4 = t4-4 t5 = a[t4] if t5>v goto B3 B4 B4 if i>=j goto B6 if i>=j goto B6 B5 B6 B5 B6
Příklad – výsledek B4 B1 i = m-1 j = n t1 = 4*n v = a[t1] t2 = 4*i t4 = 4*j if t2>=t4 goto B6 • Je to pěkný výsledek? B5 B6 a[t2] = t5 a[t4] = t3 goto B2 t14 = a[t1] a[t2] = t14 a[t1] = t3 B2 t2 = t2+4 t3 = a[t2] if t3<v goto B2 B3 t4 = t4-4 t5 = a[t4] if t5>v goto B3
Příklad – pořádný výsledek B4 B1 i = m-1 t1 = 4*n v = a[t1] t2 = 4*i t4 = t1 if t2>=t4 goto B6 • Další aplikace lokálních optimalizací na B1 B5 B6 a[t2] = t5 a[t4] = t3 goto B2 t14 = a[t1] a[t2] = t14 a[t1] = t3 B2 t2 = t2+4 t3 = a[t2] if t3<v goto B2 B3 t4 = t4-4 t5 = a[t4] if t5>v goto B3
Paralelizace a vektorizace • Paralelizace • Implicitní x explicitní • Části kódu, které lze vykonávat současně • Přednačítání proměnných do cache • Vektorizace • Paralelizace výpočtu s použitím SIMD operací
Optimalizace řízená profilem (Profile Guided Optimization) • Tři fáze • Instrumentace • Speciálně přeložený kód s voláním „sběrných“ funkcí na konci a začátku základních bloků • Profilování • Spouštění instrumentovaného programu s „typickými“ vstupy • Sběr statistických dat o průchodu kódu „sběrnými“ funkcemi • Optimalizace • Nasbíraná statistická data ovlivní optimalizaci • Využití při optimalizaci v mezikódu i kódu • Změření váhy cest v grafu toku řízení • Přidělování registrů