Path: Top -> Journal -> Jurnal Nasional Teknik Elektro dan Teknologi Informasi -> 2016 -> Vol 5, No 3 (2016)

Pengembangan Engine Integrasi Tabel HTML pada Halaman Web

Pengembangan Engine Integrasi Tabel HTML pada Halaman Web

Journal from gdlhub / 2016-11-07 03:00:40
By : Memen Akbar, Fazat Nur Azizah, G. A. Putri Saptawati, JNTETI
Created : 2016-08-01, with 1 files

Keyword : integrasi data, tabel HTML, ontologi, integrasi tabel, halaman web
Url : http://ejnteti.jteti.ugm.ac.id/index.php/JNTETI/article/view/254

Terdapat dua persoalan dalam mengintegrasikan sejumlah tabel HTML dari beberapa halaman web, yaitu: konflik struktural dan konflik semantik. Untuk mengatasi kedua masalah tersebut, makalah ini mengombinasikan beberapa metode yang telah ada dan terbukti menyelesaikan persoalan dalam proses integrasi. Terdapat empat tahapan proses dalam integrasi tabel, yaitu:(1) menentukan lokasi tabel pada halaman web, (2) memisahkan bagian atribut dan data values, (3) mengintegrasikan skema tabel, dan (4) migrasi data values ke skema terintegrasi. Lokasi tabel pada suatu halaman web tentukan dengan pendekatan heuristic. Pendekatan ini juga dapat memisahkan atribut dan data values dari tabel. Konflik semantik yang muncul saat mengintegrasikan skema tabel diatasi dengan memanfaatkan ontologi untuk suatu domain spesifik. Data values hasil integrasi kemudian dimigrasikan ke skema tabel bersamaan dengan pemeriksaan duplikasi data pada tabel dengan menggunakan vector space model. Hasil integrasi kemudian ditampilkan dalam sebuah tabel tunggal dalam bentuk HTML. Pendekatan ini diimplementasikan menjadi sebuah engine yang dibuat menggunakan Python. Hasil pengujian menunjukkan bahwa pendekatan ini dapat digunakan untuk mengintegrasikan sejumlah tabel dari beberapa halaman web menjadi sebuah tabel terintegrasi.

Description Alternative :

Two problems are arisen while integrating number of tables from number of web pages, i.e. structural conflict and semantic conflict. To tackle those problems, the proposed study combines some existing methods that are already proven to solve problems in integrating process. The proposed integration process of HTML table consists of 4 phases: (1) locating the table in web pages, (2) separating attributes and data values, (3) integrating the table scheme, (4) migrating the data values into integrated scheme. Table location in web page is determined using heuristic approach. This approach also can separate the attributes and the data values of the table. Semantic conflict that is apparent while integrating the table scheme is handled using domain specific ontology. The resulted data value, then, is migrated to table scheme in line with duplication data checking using vector space model. Result of the integration is presented as single HTML table. This approach is implemented as an engine that is coded using Phyton language. Result of experiment shows that the proposed approach can be used to integrate number of HTML table from number of web pages into a single integrated table.

Give Comment ?#(0) | Bookmark

PropertyValue
Publisher IDgdlhub
OrganizationJ
Contact NameHerti Yani, S.Kom
AddressJln. Jenderal Sudirman
CityJambi
RegionJambi
CountryIndonesia
Phone0741-35095
Fax0741-35093
Administrator E-mailelibrarystikom@gmail.com
CKO E-mailelibrarystikom@gmail.com

Print ...

Contributor...

  • , Editor: sustriani

Downnload...

  • Download for member only.

    254-382-1-SM
    Download Image
    File : 254-382-1-SM.pdf

    (881385 bytes)