Đã đóng

Hire a Programmer

Dự án này đã nhận được 27 lượt đặt giá từ các freelancer tài năng với mức đặt giá trung bình là kr16923 SEK.

Nhận tin báo giá cho dự án tương tự
Ngân sách dự án
kr9600 - kr19200 SEK
Tổng đặt giá
27
Mô tả dự án

We want to build a function that can parse HTML to find specific elements/text in the DOM tree with a callback if the element is there or not.

This can probably be done with other languages, but with a little research, I have come to the following:

1. Fetch HTML through Url

2. Parse the HTML

3. Find specific element in DOM (JSON with rules including all the elements).

4. Call back (true/false) if element is found

(?) This can be solved with a web server, using [url removed, login to view], that can receive API calls via HTTP. The server needs an XML parser that will look through the DOM tree to check that the element is matching the rules in the JSON.

(?) Config needs to be quite specific. (Eg. in DOM find div with class ”slider”, in the third slide check for text ”element”).

{

elem: ”div”,

class: ”slider”,

options: { index: 2 }

data: ”element”

}

Every element needs it own callback. let's say the JSON is for 50 elements, 48 returned ok and 2 error. The callback can be once. But instead of sending a bool (true/false), it can send a map.

{

”rule-x”: true,

”rule-y”: false,

”rule-z”: false

}

Furthermore we need to set up a client database (MySQL?) and connect everything to a front-end UI with user logins.

Every user will have their own config with rules (what sites to parse and which elements to find). The callback (if returned with false) needs to be displayed in the interface for every specific user.

Ideally the interface allows users to record data, eg. which url to parse and what elements to look for.

(We will handle the front-end.)

Các kỹ năng được yêu cầu

Muốn kiếm tiến?

  • Hạn định ngân sách và khung thời gian
  • Mô tả đề xuất của bạn
  • Nhận thanh toán cho công việc của bạn

Thuê những Freelancer đã đặt giá trong dự án này

    • Forbes
    • The New York Times
    • Time
    • Wall Street Journal
    • Times Online