Názov práce:   

Program na spracovanie konferenčných príspevkov

Miesto:

Katedra počítačov a informatiky, TU FEI Košice

Autor:

Lukáš Pástor

Vedúci DP:

Ing. Ladislav Samuelis, CSc.

Konzultant DP:

Ing. Gejza Bodon

Dátum:

05.05.2003

Kľúčové slová:

konferencia, databáza , Java , JDBC, MySQL, SQL, Servlet, CSS

Anotácia:

Diplomová práca realizuje transformáciu konferenčných príspevkov do jednotného tvaru a umožňuje vyhľadávať v nich. Architektúra programu je založená na Internete a komunikácii cez WWW použitím technológie java servletov.

 

 

 

OBSAH

 

 

OBSAH.. 1

1      Úvod.. 2

2        Formulácia úlohy.. 4

3        Použité programové prostriedky a technológie   5

3.1            Služba WWW... 5

3.2            Jazyk Java.. 7

3.3            Java servlety.. 11

3.4            Rozhranie JDBC   14

3.4.1                Charakteristika JDBC   14

3.4.2                Porovnanie JDBC a ODBC   14

3.4.3                Model prístupu  15

3.4.4                JDBC architektúra  15

3.4.5                Prehľad hlavných rozhraní JDBC   16

4        SGML/XML   17

4.1            HTML a SGML verzus XML  17

4.2            Základné chápanie XML  17

5        Analýza návrhu riešenia.. 21

5.1            Základná architektúra   21

5.2            Vkladanie a správa príspevkov   21

5.3            Prezeranie príspevkov   25

5.4            Návrh dátového modelu.. 26

6        Implementácia systému.. 30

6.1            Spôsob pripojenia programov k databáze  31

7        Zhodnotenie riešenia.. 33

8        Literatúra.. 34

9        Zoznam príloh.. 35

 

 

1         Úvod

 

Posledné roky minulého storočia a začiatok tohto, boli poznačené vývojom automatických strojov, ktoré vykonávali isté operácie podľa presne stanoveného postupu – algoritmu. Tieto stroje sa nazvali počítače. Názov „počítač“ bol zvolený, preto lebo v dávnych časoch (pred 50 rokmi)  bol počítač naozaj určený len na riešenie úloh výpočtového charakteru. Ale s postupom času sa zistilo, že počítač dokáže veľmi rýchlo porovnávať, triediť a vyhľadávať. A tak sa z počítača (ako technického zariadenia) stal veľmi dobrý priateľ človeka. Človek sa snažil využiť jeho rýchlosť, presnosť s jediným a hlavným cieľom a to uľahčiť si život. Tak sa počítače dostali do rôznych odvetí, okrem iného si našli využitie v archivácii a spracovávaní dokumentov (informácii) rôzneho charakteru. Zdá sa, že používanie počítačových systémov na už spomínané spracovanie a archiváciu informácii sa stalo akousi kapitolou samou osebe, ktorá si zaslúži podrobnejšie preskúmanie.

 

Skutočne ťažké je mať v informáciach prehľad, lebo informácii je veľmi veľa a nikto nemôže vedieť a poznať všetko. Preto je vhodné použiť počítače na vyhľadanie tých správnych informácii, teda na informácie istého charakteru (napríklad tématické spracovanie informácii). Takto môžme mať pekne pokope informácie o okolitom prostredí (mapa prostredia), o zdravý človeka (informácie lekárskeho charakteru), o vzťahu planét vo vesmíre a podobne.

 

Jedným z prostriedkov akým si ľudia odovzdávajú informácie, je ich publikovanie na rôznych konferenciách. Tu sa schádzajú rôzny vedci, ktorý si svojimi príspevkami k téme vymieňajú informácie z rôznych vedných disciplín. Takéto konferencie majú zväčša nabitý program a veľká časť prispievateľov publikuje svoj príspevok v rovnakom čase ako iný prispievatelia (samozrejme v inej miestnosti). Týmto dochádza k javu, že poslucháč si nemôže vypočuť všetky príspevky ale musí na rozhodnúť, ktorý z príspevkov bude preňho poučnejší a zlepší jeho odbornosť v oblasti.

Z tohoto dôvodu vydávajú organizátori rôzne zborníky v ktorých sú zachytené (v textovej forme) prejavy všetkých rečníkov. Takto už nie je nutné zúčastniť sa na prezentácii všetkých možných príspevkov, veď informácie sú zachytené „na papiery“.

V dokumentoch vo fyzickej forme (papier), nie je ale možné rýchlo vyhľadávať informácie (samozrejme každý zborník má obsah, register použitých termínov ale tie zväčša nepostačujú). Pri dokumentoch v elektronickej podobe je možné tieto dokumenty uchovávať, zoraďovať, triediť podľa najrozmanitejších kategórii. Preto na rýchle oboznámenie sa s príspevkami konferencie je vhodnejšia elektronická verzia dokumentov.  A aby sa tieto dokumenty dostali čo najrýchlejšie k ich príjemcovi je vhodné použiť elektronickú sieť, ktorou sú prepojené počítače. Teda na jednom počítači (u organizátora konferencie), budú uložené všetky príspevky a široká verejnosť (alebo len vybraný používatelia) si budú môcť prezrieť príspevky na ich počítači, ktorý je samozrejme sieťovými technológiami prepojený s počítačom organizátora konferencie. Týmto sa dosiahne, že informácie sa k používateľovi dostanú vo veľmi rýchlom čase.

Prispievatelia na konferenciách majú svoje príspevky v elektronickej forme, preto sa zdá byť jednoduché publikovať ich.  Problém ale nastáva s formátom príspevkov, lebo väčšinou každý autor napísal svoj príspevok v inom textovom editore. Aj keby boli príspevky písané jedným editorom aj tak by problémy neprestávali. Každý prispievateľ používa iné zvýrazňovače textu ako sú veľkosť písma, typ písma, farba písma. Preto keby sa takýto zborník iba jednoducho poskladal z jednotlivých príspevkov, dopadlo by to asi tak, že každý z príspevkov by mal iné formátovanie textu, farby a pod. V takomto texte by bolo problematické zistiť aká časť textu je napríklad názov príspevku, aká časť na anotácia príspevku a podobne. Snahou je ale toto formátovanie zjednotiť za účelom automatického spracovávanie jednotlivých príspevkov, lebo keď budú mať príspevky rovnaký tvar bude už jednoduché ich automaticky spracovávať.

 

Snahou mojej diplomovej práce je vytvoriť systém, ktorým bude možné tieto príspevky poskytnúť používateľovi v upravenom a ľahko čitateľnom tvare.