610 likes | 708 Views
Aspectes d’administració de l’emmagatzematge d’Oracle (parcialement basat en la Guia de l’estudiant “Oracle 8: Database Administration”). Toni Navarrete Enginyeria del Software II – UPF 200 4. Normalització: 1FN. Una relació R està en 1FN si i només si cada columna conté només valors atòmics
E N D
Aspectes d’administració de l’emmagatzematge d’Oracle(parcialement basat en la Guia de l’estudiant “Oracle 8: Database Administration”) Toni Navarrete Enginyeria del Software II – UPF 2004
Normalització: 1FN • Una relació R està en 1FN si i només si cada columna conté només valors atòmics • (un atribut només pot tenir un valor)
Normalització: 2FN • Una relació R està en 2FN si i només si està en 1FN i tots els atributs que no formen part de la clau primària tenen dependència funcional completa d’aquesta • (no s’adment que un atribut depengui només d’una part de la clau)
Normalització: 3FN • Dependència no transitiva: és una relació que té almenys tres atributs (A,B,C), on A determina B, B determina C, però C no determina A • Una relació R està en 3FN si i només si està en 2FN i tots els seus atributs que no pertanyen a la clau primària depenen no transitivament d’aquesta • (no hi haurà cap atribut que depengui d’un altre que no sigui clau primària; si fos així, han d’anar a una altra relació)
Estructura de l’emmagatzematge a Oracle Database Tablespace Data file Logical Physical Segment Extent Oracle block O/S Block
Què és un espai de taules (tablespace)? • És el nom que es dóna a un grup d’un o més arxius de bases de dades • Quan es creen “objectes” es pot especificar en quin espai de taules • Control sobre on i quin espai d’emmagatzematge s’utilitza • N’hi ha un espai de taules anomenat SYSTEM
SYSTEM Tablespacecontains: Data dictionary information SYSTEM rollback segment Tablespaces SYSTEM i no SYSTEM • Non-SYSTEMTablespace contains: • Rollback segments • Temporary segments • Application data • Application indexes
Com es crea un tablespace? CREATE TABLESPACE nom DATAFILE filespec [clàusula_autoextend] [, filespec [clàusula_autoextend]]... [MINIMUM EXTENT integer[K|M]] [DEFAULT clàusula_storage] [PERMANENT|TEMPORARY] [ONLINE|OFFLINE] Exemple: CREATE TABLESPACE app_data DATAFILE ‘/...../app01.dbf’ SIZE 100M, ‘/...../app02.dbf’ SIZE 100M MINIMUM EXTENT 500K DEFAULT STORAGE (INITIAL 500K NEXT 500K MAXEXTENTS 500 PCTINCREASE 0);
Storage • L’espai està estructurat en blocs • El tamany d’aquests blocs està definit quan es munta la BD, normalment és el mateix tamany que els blocs de SO (per exemple en Linux 4K) • Quan es crea un segment (una taula, per exemple), se li assigna un extent (extensió). • El seu tamany ve determinat per INITIAL • El valor per defecte és 5*tamany del bloc
Storage • En aquest primer extent es posen dades de control del segment i l’espai restant s’usa per insercions de files • Quan és ple, es crea un segon • El seu tamany vé determinar per NEXT • Per defecte també 5*tamany de bloc • I així successivament, es pot configurar que cada extent nou sigui en un % més gran que l’anterior • Clàusula PCTINCREASE • Valor per defecte: 50 (arrodonit a l’alça a múltiples de 5) • La creació de nous extents és un procés bastant costòs • Es pot limitar el nombre màxim d’extents • MAXEXTENTS
Exemple Storage • 1er extent: 5 blocs = 20K • 2on extent: 5 blocs = 20K • 3er extent: 10 blocs (5*1,5=7,5 redondejats) = 40K • 4rt extent: 15 blocs (7,5*1,5=11,25) = 60K • 5è extent: 20 blocs (11,25*1,5=16,875) = 80K
Com obtenim informació dels tablespaces existents? • Taula del diccionari de dades dba_tablespaces (o user_tablespaces) SELECT tablespace_name, initial_extent, next_extent,max_extents, pct_increase, min_extlen FROM dba_tablespaces; • Els comptes d’usuari es2_xx només tenen permís per veure els tablespaces definits pel propi usuari (no poden accedir a dba_tablespaces) • user_tablespaces
Recomanació • A la taula del diccionari de dades dba_extents (user_extents) tenim els extents • Si un segment té més de 10 extents és convenient refer la taula • Abans de crear (o refer) una taula, convé calcular l’espai de les dades que ja té per assignar-ho al primer extent
Cluster Tipus de segments (1/3) Table Table partition Index
Index-organizedtable Tipus de segments (2/3) Index partition Rollbacksegment Temporarysegment
Tipus de segments (3/3) LOBsegment LOB index Nested table Bootstrapsegment
Jerarquia de les clàusules d’emmagatzematge • Un segment pot tenir les seves pròpies clàusules de storage • Nivells de prioritat: • Especificat al nivell del segment (per exemple en fer un Create Table) • Especificat al nivell de l’espai de taules (en fer un Create Tablespace) • Valors per defecte d’Oracle Oracle default Tablespace Segment
Unificant extents lliures colindants (evitant fragmentacions) • Això passa, per exemple, si s’esborren dues taules consecutives • Per determinar els exten fragmentats: • Vista DBA_FREE_SPACE_COALESCED • Nota: “coalesce”=fusionarse, unirse • Consulta: SELECT tablespace_name, total_extents, percent_extents_coalesced FROM dba_free_space_coalesced WHERE percent_extens_coalesced <>100;
Before After File header Used extent Free extent Unificant extents lliures colindants (evitant fragmentacions) ALTER TABLESPACE data01 COALESCE;
Control de l’espai usat per bloc • PCTFREE (d’un segment de dades) representa el % de cada bloc que deixem lliure per suportar el creixement per “updates” de la fila • PCTUSED (d’un segment de dades) representa el % mínim d’espai utilitzat d’un bloc
Inserts Control de l’espai usat per bloc PCTFREE=20 PCTUSED=40 Inserts Inserts 80% 1 2 80% Inserts 40% 3 4
Data Dictionary Views Used extents DBA_EXTENTS Free extents DBA_FREE_SPACE Segments DBA_SEGMENTS Data files DBA_DATA_FILES Tablespaces DBA_TABLESPACES
Gestionant taules. Creació CREATE TABLE nom( columna tipus [, columna tipus]...) [TABLESPACE nom_tablespace] [PCTFREE integer] [PCTUSED integer] [INITRANS integer] [MAXTRANS integer] [STORAGE clàusula_storage] [LOGGING|NOLOGGING] [CACHE|NOCACHE] INITRANS: nº de slots per transaccions* preassignades a cada bloc (1 per defecte) MAXTRANS: nº màxim de slots per transaccions* assignades a cada bloc (255 per defecte) LOGGING: s’utilitza un redo log file (les operacions són es guarden a un log) CACHE: s’usa una cache a memoria * Un slot per transaccions és un espai reservat que s’utilitza per guardar informació sobre les transaccions que fan canvis al bloc en un moment concret
Gestionant taules. Creació (un exemple) CREATE TABLE employees( empno NUMBER(4), last_name VARCHAR2(30) deptno NUMBER(2)) PCTFREE 20 PCTUSED 50 STORAGE(INITIAL 200K NEXT 200K PCTINCREASE 0 MAXEXTENTS 50) TABLESPACE data01;
Gestionant taules • Posar les taules en un tablespace diferent • No amb rollback segments, temporary segments ni índexs • A ser possible a discos diferents per evitar colls d’ampolla • Per defecte, els vostres segments es creen al tablespace users • Utilitzar tamanys d’extent “estàndard” múltiples de 5*DB_BLOCK_SIZE, per minimitzar la fragmentació • Usar la clàusula CACHE per petites taules de referència que s’accedeixen molt freqüentment • Valorar si NOLOGGING per guanyar eficiència (arriscat!)
(Average Row Size - Initial Row Size) * 100 Average Row Size Average Row Size * 100100 - PCTFREE - Available Data Space Gestió de taules. Càlcul de PCTFREE i PCTUSED • Compute PCTFREE • Un alt PCTFREE suposa més espai per a les modificacions i una menor densitat (menys files per bloc) • Aquesta fórmula assegura que hi hagi espai per fer crèixer les files • Compute PCTUSED • Quan s’ha de fer una inserció, es fa una búsqueda linial fins a trobar un bloc amb espai suficient (si n’hi ha) • La fórmula pretén reduir el temps d’aquesta búsqueda, de forma que s’incrementi la probabilitat de trobar un bloc amb espai
Gestió de taules. Reassignant l’espai sense usar (després de diversos deletes) • El “High water mark” indica el darrer bloc que ha estat usat • Una lectura de la taula per blocs s’aturarà en arribar-hi • Amb un deallocate unused desassignem els blocs no usat dels extents d’un segment perquè es puguin assignar a d’altres Beforedeallocation ALTER TABLE employees DEALLOCATE UNUSED; High water mark Afterdeallocation Used block Unused block Free space after delete
Diccionari de dades de les taules DBA_OBJECTS OWNER OBJECT_NAME OBJECT_ID DATA_OBJECT_ID CREATED DBA_TABLES OWNER TABLE_NAME PCT_FREE PCT_USED INITIAL_EXTENT NEXT_EXTENT MIN_EXTENTS MAX_EXTENTS PCT_INCREASE CACHE BLOCKS EMPTY_BLOCKS CHAIN_CNT DBA_EXTENTS OWNER SEGMENT_NAME EXTENT_ID FILE_ID BLOCK_ID BLOCKS DBA_SEGMENTS OWNER SEGMENT_NAME TABLESPACE_NAME HEADER_FILE HEADER_BLOCK
Exemple amb el diccionari de dades • Exemple: recuperar els extents de la taula empleats SELECT file_id, SUM(blocks) AS Blocks FROM dba_extents WHERE segment_name=‘empleats’;
Validant l’estructura • The Oracle server verifies the integrity of each data block. • Use the CASCADE option to validate the structure of all indexes on the table, and perform cross-referencing between the table and its indexes. ANALYZE TABLE empleats VALIDATE STRUCTURE;
Gestionant índexs: tipus d’índexs • A nivell lògic: • De columna simple o concatenat • Únic o no únic • A nivell físic: • Arbre B o Bitmap • Si Arbre B: de clave normal o revers • Particionat o no particionat
Arbre B Index entry Root Branch Index entry header Key column length Leaf Key column value ROWID (veure seg. transp.) Un parell (key column length, key column value) per a cada camp de la clau
Rowid • Normal Rowid: • Unique identifier for a row • Used to locate a row • Restricted Rowid: • Can identify rows within a segment • Needs less space OOOOOO FFF BBBBBB RRR Data object number Relative file number Block number Row number . . BBBBBBBB RRRR FFFF Block number Row number File number
Algunes característiques dels arbres B d’Oracle • Si hi ha múltiples files amb els mateixos valors de claus, aquests s’han de repetir a l’arbre • No hi ha entrada a l’índex si per a una fila, tots els valors de les columnes clau són NULL • S’utilitza Rowid restringit, ja que totes les files pertanyen al mateix segment
Algunes característiques dels arbres B d’Oracle • Les operacions d’insert, resulten també en la inserció d’una entrada a l’índex • Les operacions de delete d’una fila, produeix només un esborrat lògic de l’entrada de l’índex: • l’espai no està disponible fins que no s’hagin esborrat totes les entrades del bloc • Els update de columnes de clau, es corresponen a un esborrat lògic i una inserció a l’índex
Creació d’ún índex amb arbre B (un exemple) CREATE INDEX emp_lname_idx ON employees(last_name) PCTFREE 30 STORAGE(INITIAL 200K NEXT 200K PCTINCREASE 0 MAXEXTENTS 50) TABLESPACE indx01;
Consells per crear índexs • Els índex acceleren consultes però enlenteixen operacions DML (A/B/M) (veure seg. transp.) • Situar l’índex en un tablespace diferent al de la taula (també diferent del rollback i temporary segment) • Utilitzar tamanys d’extent uniformes, típicament múltiples de 5 blocs • L’ús de NOLOGGING per grans índexs pot millorar l’eficiència • Les files d’un índex són més petites que les d’una taula. Això fa que hi hagi moltes més files per bloc que en una taula. Per això, INITRANS és típicament més gran que en una taula • Especificar un alt PCTFREE si és probable que hi hagi insercions de valors entre dues claus (això no passa si les claus son correlatives)
Nombre d’índexs per taula • A table can have any number of indexes. However, the more indexes there are, the more overhead is incurred as the table is modified. Specifically, when rows are inserted or deleted, all indexes on the table must be updated as well. Also, when a column is updated, all indexes that contain the column must be updated. • Thus, there is a trade-off between the speed of retrieving data from a table and the speed of updating the table. For example, if a table is primarily read-only, having more indexes can be useful; but if a table is heavily updated, having fewer indexes may be preferable.
Índex revers Index on EMP (EMPNO) EMPNO ENAME JOB ... ----- ----- -------- 7499 ALLEN SALESMAN 7369 SMITH CLERK 7521 WARD SALESMAN ... 7566 JONES MANAGER 7654 MARTIN SALESMAN 7698 BLAKE MANAGER 7782 CLARK MANAGER ... ... ... ... ... ... ... ... EMP table KEY ROWID EMPNO (BLOCK# ROW# FILE#) ----- ------------------- 1257 0000000F.0002.0001 2877 0000000F.0006.0001 4567 0000000F.0004.0001 6657 0000000F.0003.0001 8967 0000000F.0005.0001 9637 0000000F.0001.0001 9947 0000000F.0000.0001 ... ... ... ... • Per evitar que amb claus correlatives tots els valors s’insereixen al mateix lloc de l’arbre • Especialment útil en entorns paral·lelitzats
Creació d’un índex revers (un exemple) CREATE UNIQUE INDEX ord_ord_no_idx ON ord(ord_no) REVERSE PCTFREE 30 STORAGE(INITIAL 200K NEXT 200K PCTINCREASE 0 MAXEXTENTS 50) TABLESPACE indx01;
start ROWID end ROWID key bitmap <Blue, 10.0.3, 12.8.3, 1000100100010010100> <Green, 10.0.3, 12.8.3, 0001010000100100000> <Red, 10.0.3, 12.8.3, 0100000011000001001> <Yellow, 10.0.3, 12.8.3, 0010001000001000010> Índex Bitmap File 3 Table Block 10 • Útil quan: • Taules llargues on la columna clau té baixa cardinalitat (pocs possibles valors) • Quan les consultes utilitzen l’operador OR Block 11 Block 12 Index
Comparació entre arbres B i índex bitmap B-tree Suitable for high-cardinality columns Updates on keys relativelyinexpensive Inefficient for queries using OR predicates Bitmap Suitable for low-cardinality columns Updates to key columns veryexpensive (pel nivell de bloquejos) Efficient for queries using OR predicates
Creació d’un índex bitmap (un exemple) CREATE BITMAP INDEX ord_region_id_idx ON ord(region_id) PCTFREE 30 STORAGE(INITIAL 200K NEXT 200K PCTINCREASE 0 MAXEXTENTS 50) TABLESPACE indx01;
Modificar els paràmetres d’emmagatzematge • Exemple: ALTER INDEX emp_lname_idx STORAGE(NEXT 400KMAXEXTENTS 100);
Reconstruir un índex Use this command to: • Move an index to a different tablespace • Improve space utilization by removing deleted entries • Change a reverse key index to a normal B-tree index and vice versa ALTER INDEX ord_region_id_idx REBUILDTABLESPACE indx02;
Validant un índex ANALYZE INDEX ord_region_id_idx VALIDATE STRUCTURE; INDEX_STATS SELECT blocks, pctused, distinct_keys, lf_rows, del_lf_rows FROM index_stats; Reorganitzar l’índex si el rati del_lf_rows a lf_rows passa del 30%
Clusters i taules organitzades per índex • La disposició de les dades als blocs no és aleatòria • Clusters: organitzats per una clau (o conjunt de claus) • Taules organitzades per índex: els valors estan als nodes fulla de l’arbre B de l’índex
Distribució de files a les taules Table Cluster Index-organizedtable Ordering of Rows Random Grouped Ordered
ORD_NO PROD QTY ... ----- ------ ------ 101 A4102 20 102 A2091 11 102 G7830 20 102 N9587 26 101 A5675 19 101 W0824 10 Cluster Key (ORD_NO) 101 ORD_DT CUST_CD 05-JAN-97 R01 PROD QTY A4102 20 A5675 19 W0824 10 102 ORD_DT CUST_CD 07-JAN-97 N45 PROD QTY A2091 11 G7830 20 N9587 26 ORD_NO ORD_DT CUST_CD ------ ------ ------ 101 05-JAN-97 R01 102 07-JAN-97 N45 Cluster Clustered ORD and ITEM tables (VENDA i LINIA_VENDA) Unclustered ORD and ITEM tables (VENDA i LINIA_VENDA)
Hash cluster Dos tipus de clusters Index cluster Hash function