250 likes | 372 Views
Aplikační a programové vybavení. Databáze – speciality šéfkuchařů. Databázové systémy. Nejpoužívanější relační databázové systémy: Adaptive Server Enterprise (Sybase) DB2 (IBM) Firebird MySQL Oracle Database PostgreSQL SQL Server (Microsoft) SQLite
E N D
Aplikační a programové vybavení Databáze – speciality šéfkuchařů
Databázové systémy • Nejpoužívanější relační databázové systémy: • Adaptive Server Enterprise (Sybase) • DB2 (IBM) • Firebird • MySQL • Oracle Database • PostgreSQL • SQL Server (Microsoft) • SQLite • Každý systém implementuje jazyk SQL jinak a žádný úplně. • Mezi jednotlivými DBS bývají velké rozdíly.
Rozhraní • Pro práci s databázovým systémem se vždy používá nějaké rozhraní: • Firemní • pouze pro jeden konkrétní DB systém • zpravidla více funkcí • optimální výkon • Obecná • obvykle větší podpora standardů • použitelné z různých aplikací a pro různé DBS • ODBC, ADODB, JDBC, … • Každé rozhraní poskytuje funkce pro připojení k databázi, vykonání dotazu, vypsání výsledku dotazu a zjištění chyb.
Datové typy - řetězce • character_varying(mohutnost) / varchar(mohutnost) / nvarchar(mohutnost) • standardní řetězec, omezený délkou • mohutnost se udává v byte [B] • char(mohutnost) / character(mohutnost) / nchar(mohutnost) • řetězec omezený délkou • doplňuje se mezerami • operátor LIKE porovnává řetězce bez mezer • text / ntext • „neomezený“ řetězec
Datové typy – celá čísla • bigint(šířka) – 8B – -263..263 • 263 = 9 223 372 036 854 775 808 • integer(šířka) – 4B – -231..232 • mediumint(šířka) – 3B – -223..223 • smallint(šířka) – 2B – -215..215 • tinyint(šířka) – 1B – -27..27 • celé číslo • signed(se znaménkem) – záporné rozsahy • unsigned (bez znaménka) – pouze kladná čísla • pozor na převod mezi signed a unsigned
Datové typy – desetinná čísla • real / float(velikost) • plovoucí desetinná čárka • velikost <= 24 – 7 číslic, 4 byty • velikost > 24 – 15 číslic, 8 bytů • number / numeric / decimal(přesnost, měřítko) • pevná desetinná čárka • přesnost – maximální počet platných číslic • měřítko – počet číslic za desetinnou čárkou • velikost – 5..17 bytů podle nastavení • money -263..263 = 922 337 203 685 477,5808
Datové typy – datum a čas • timestamp • Datum a čas se ukládá jako časové razítko. • Časové razítko je počet milisekund od 1.1.1970. • platné pouze do 19.1.2038 03:14:07 • Převod na běžný formát data je velice složitý, je nutné počítat se přestupnými dny a sekundami. • Timestampnení možné použít k uložení intervalu (rok, měsíc, den, …). • Podle SQL standardu by měl typ timestampobsahovat i časovou zónu. • datetime / date / time • větší rozsah a přesnost • uložení intervalu • komplexní datový typ
Datové typy – datum • je možné použít také formát data aplikace – např. • pg_query("UPDATE osoby SET datum_narozeni=". time()); • datový typ sloupce je integer • výhody: • jednoduché, pro jednu aplikaci bezproblémové • nevýhody: • není atomické, nelze vyhledávat podle části data (lze pouze řadit) • obtížně se zobrazuje interval – respektive závisí to na aplikaci • vracíme se k problému závislosti dat a aplikace • nespolehlivé pokud k databázi přistupuje více aplikací
Datové typy – binární data • bit / boolean/ binary – jedna hodnota • BLOB / image – binární data • BLOB – binary large object • Detaily práce s binárními daty závisí na použitém rozhraní. • Jednodušší případ: • Data je možno odesílat (po správném escapování) SQL dotazem a přijímat v rámci jeho výsledků. • Od určité velikosti nemusí fungovat správně. • Složitější případ: • Binární data (může zahrnovat i typ text) je nutné odesílat a přijímat speciálními funkcemi.
Definice struktury databáze • SQL příkaz CREATE • CREATE TABLE nazev_tabulky (sloupec datovy_typ [NOT NULL][DEFAULT hodnota] [PRIMARY KEY][,sloupecdatovy_typ…]) • CREATE TABLE kontakty(id serial PRIMARY KEY,osoba integer NOT NULL REFERENCES osoby,typ integer REFERENCEStypy_kontaktu,kontakt varchar(200) NOT NULL)
Definice struktury databáze • Prakticky není možné využívat SQL pro definici databáze mezi jednotlivými DBS. • Každý DB systém používá jiné datové typy • Generovaný primární klíč je implementován různě • Jednotlivé DBS používají rozšíření, která významně ovlivňují práci s DB (např. MySQL – MyISAM × InnoDB) • SQL pro definici struktury se používá nejčastěji pro import a export struktury v rámci jednoho DBS. • Pro převod dat mezi DB systémy je nutné používat nástroje pro migraci (migration toolkit)
Automatický generovaný klíč (ID) • nejčastěji používaný typ primárního klíče • abstraktní identifikátor záznamu • nezávislý na vnějších podmínkách • odpadají problémy se složeným klíčem • kromě něj by měl existovat ještě jiný klíč (definice relace) • Žádný databázový systém neodpovídá přesně standardu. • Mezi jednotlivými databázovými systémy jsou velké rozdíly.
ID - MySQL • sloupci se přiřadí speciální atribut auto_increment • při vložení dat INSERT dotazem se klíč automaticky aktualizuje i v případě, že je hodnota zadaná (např. při importování) • SELECT LAST_INSERT_ID(); • pouze jeden sloupec v tabulce může mít atribut nastaven musí být klíčem • CREATE TABLE tabulka (id int(5) unsigned NOT NULL auto_increment)
ID – MS SQL • sloupci se přiřadí speciální atribut is_identity • při vložení dat INSERT dotazem se klíč automaticky aktualizuje • SELECT IDENT_CURRENT('nazev_tabulky'); • v případě, že je hodnota sloupce zadaná, je nutné použít příkazy: • SET IDENTITY INSERT on – povolí vkládání dat • SET IDENTITY INSERT off – ukončí vkládání dat • vkládání dat do generovaného klíče může být povoleno pouze pro jednu tabulku • CREATE TABLE tabulka (id int(5) unsigned NOT NULL is_identity,
ID - PostgreSQL • Sloupci se přiřadí speciální datový typ SERIAL • Automaticky se vytvoří sekvence pro generování hodnot klíče. • Při vložení dat INSERT dotazem se klíč automaticky aktualizuje. • SELECT currval('nazev_sekvence') • V případě, že je hodnota sloupce explicitně zadaná se klíč neaktualizuje! • CREATE TABLE tabulka (id serial NOT NULL,
Autoincrement, Identiy, Currval ? • Pro zjištění hodnoty ID posledního vloženého záznamu se musí používat předdefinované funkce. • Nefunguje: SELECT MAX(id) FROM tabulka • Zjištění hodnoty musí být thread-safe • viz Obrázky: • http://akela.mendelu.cz/~xpopelka/cs/apv/ost/sekvence-currval.pdf • http://akela.mendelu.cz/~xpopelka/cs/apv/ost/sekvence-max.pdf • http://akela.mendelu.cz/~xpopelka/cs/apv/ost/sekvence-max-soubeh.pdf
Referenční integritní omezení • integritní omezení – NOT NULL, UNIQUE, PRIMARY KEY, CHECK • cizí klíč zpravidla představuje referenční integritní omezení • nelze změnit záznam v jedné tabulce bez aktualizace záznamů, které se na něj odkazují • Příklad: • sloupec osoba v tabulce kontakty se odkazuje na tabulku osoby • při smazání osoby je žádoucíupravit i všechny připojené kontakty • CASCADE – smazat • RESTRICT / NO ACTION - nepovolit smazání osoby • SET NULL – nastavit hodnoty ve sloupci na NULL • CREATE TABLE kontakty (osoba integer NOT NULL REFERENCES osoby ON DELETE CASCADE • osoby-kontakty vs. osoby- adresy
Referenční integritní omezení Adresy Při odstranění adresy se stane id_adresy=11 neplatné. ON DELETE SET NULLsmaže pouze referenci, pravděpodobně není žádoucí smazat odkazující se záznam. Osoby Při odstranění Karla z databáze se stane id_osoby=2neplatné. ON DELETE CASCADEsmaže i záznamy, které se na tuto hodnotu odkazují. Kontakty
Úprava struktury databáze • Struktura databáze je uložena ve speciální databázi INFORMATION_SCHEMA • Pro DBS, které INFORMATION_SCHEMA nepodporují je možné použít příkazů DESCRIBE, SHOW, LIST, ALTER, RENAME, DROP, MODIFY, ADD… • Příklad: • SHOW TABLES FROM databaze; • SELECT * FROM INFORMATION_SCHEMA.TABLESWHERE TABLE_TYPE = 'BASE TABLE' ;
Omezení počtu řádků dotazu • Nestandardní (PgSQL, MySQL): • SELECT ... LIMIT n; • SELECT vyska FROM osoby ORDER BY vyska DESC LIMIT 10; • Standardní (SQL Server): • SELECT [TOP | BOTTOM n] FROM ... • SELECT TOP 10 vyska FROM osoby ORDER BY vyska DESC; • A další: • SELECT vyska FROM osoby ORDER BY vyska DESC WHERE ROWNUM <= 10;
Index • volba primárního klíče souvisí se způsobem ukládání dat v DBS • ISAM (Index Sequential Access Method) • využívá se indexových souborů (telefonní seznam) • u moderních DBS už se využívají jiné metody, pro snížení časové složitosti operací datový soubor index
Nadstavby SQL Doctrine Query Language (DQL), Hibernate Query Language (HQL), Java Persistence Query Language (JPQL), JOOQ, … Obvykle ORM (Object-Relational Mapping) vrstva a jazyk, který se dotazuje objektového modelu. Pro určité typy (části) aplikací je ORM úžasné, pro jiné je dost nevhodné. $query = $em->createQuery('SELECT COUNT(a.id) FROM CmsUser u LEFT JOIN u.articles a WHERE u.username = ?1 GROUP BY u.id'); $query->setParameter(1, 'jwage');
Fluent interface $qb->select('u') ->from('User u') ->where('u.id = ?1') ->orderBy('u.name', 'ASC') ->setParameter(1, 100); Ve velmi výjimečných případech nutné Někdy přehlednější, často nepřehlednější Dotaz nelze snadno testovat a přenášet do jiné aplikace. Vymyslet se to musí úplně stejně.
Volně dostupné relační DBS • Firebird: • http://www.firebirdsql.org/ • MySQL • http://dev.mysql.com/ • Microsoft SQLServer (Express edice) • http://msdn2.microsoft.com/en-us/sql/default.aspx • Oracle (Express edice) • http://www.oracle.com/technology/products/database/oracle10g/index.html • PostgreSQL • http://www.postgresql.org/ • SQLite • http://www.sqlite.org/ • DB2 Express • http://www.ibm.com/software/data/db2/express/