Pertanyaan yang diberi tag «parsing»

Menganalisis (tidak) data terstruktur untuk mengubahnya menjadi format terstruktur dan dinormalisasi.

5
Mendapatkan data dari halaman web dengan cara yang stabil dan efisien
Baru-baru ini saya telah belajar bahwa menggunakan regex untuk mem-parsing HTML situs web untuk mendapatkan data yang Anda butuhkan bukanlah tindakan terbaik. Jadi pertanyaan saya sederhana: Lalu, apakah cara terbaik / paling efisien dan umumnya stabil untuk mendapatkan data ini? Saya harus mencatat bahwa: Tidak ada API Tidak ada sumber …
11 data  parsing 

7
Teknik untuk parsing XML
Saya selalu menemukan XML agak rumit untuk diproses. Saya tidak berbicara tentang menerapkan parser XML: Saya berbicara tentang menggunakan parser berbasis aliran yang ada, seperti parser SAX, yang memproses XML node demi node. Ya, sangat mudah untuk mempelajari berbagai API untuk parser ini, tetapi setiap kali saya melihat kode yang …

2
Algoritma untuk memformat kode SQL
Saya membutuhkan alat (untuk penggunaan di rumah) yang akan memformat kode SQL (SQL Server / MySQL). Ada berbagai alat pihak ke-3 dan situs web online yang melakukannya tetapi tidak persis bagaimana saya membutuhkannya. Jadi saya ingin menulis alat sendiri yang sesuai dengan kebutuhan saya. Pertanyaan pertama apakah ada standar atau …



3
Menulis Kompiler Kompiler - Wawasan Penggunaan dan Fitur
Ini adalah bagian dari serangkaian pertanyaan yang berfokus pada proyek saudara ke Proyek Abstraksi, yang bertujuan untuk abstrak konsep yang digunakan dalam desain bahasa dalam bentuk kerangka kerja. Proyek saudara disebut OILexer, yang bertujuan untuk membangun parser dari file tata bahasa, tanpa menggunakan injeksi kode pada pertandingan. Beberapa halaman lain …

2
Penguraian bahasa untuk menemukan kata-kata penting
Saya mencari beberapa masukan dan teori tentang cara mendekati topik leksikal. Katakanlah saya memiliki koleksi string, yang mungkin hanya satu kalimat atau berpotensi beberapa kalimat. Saya ingin mengurai string ini dan merobek kata-kata yang paling penting, mungkin dengan skor yang menunjukkan seberapa besar kemungkinan kata itu penting. Mari kita lihat …



6
Cara terbaik untuk mem-parsing file
Saya mencoba mencari solusi yang lebih baik untuk membuat parser ke beberapa format file terkenal di luar sana seperti: EDIFACT dan TRADACOMS . Jika Anda tidak terbiasa dengan standar ini maka lihat contoh ini dari Wikipedia: Lihat di bawah untuk contoh pesan EDIFACT yang digunakan untuk menjawab permintaan ketersediaan produk: …


1
secara kuantitatif membandingkan bentuk AST
Bagaimana kita bisa membandingkan bentuk pohon sintaksis abstrak dari program kode sumber serupa (C, C ++, Go, atau apa pun yang dikompilasi dengan GCC ...)? Saya kira deteksi plagiarisme pada kode sumber akan menggunakan teknik-teknik seperti itu, tetapi saya tidak tahu bagaimana itu disebut ... Misalnya, unifikasi dapat digunakan untuk …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.