Skip to search formSkip to main contentSkip to account menu

jsoup

jsoup is an open-source Java library of methods designed to extract and manipulate data stored in HTML documents.
Wikipedia (opens in a new tab)

Papers overview

Semantic Scholar uses AI to extract papers important to this topic.
2018
2018
Terdapat milyaran dokumen web di world wide web yang terus bertumbuh dalam volume, kecepatan dan kompleksitas yang besar dan… 
2017
2017
본 논문에서는 대학생 및 취업준비생의 대외활동, 공모전, 장학금에 대한 효율적인 정보 수집을 위한 웹 크롤러 서비스 방식을 제안한다. 제안된 웹 크롤러 서비스는 빠른 속도로 크롤링하면서 중복해서 크롤링되는 문제를 회피하기 위하여 Jsoup 트리 분석과 Json 형식의 데이터 전송 방식을 이용하였다. 24시간 동안 관련 정보를 수집한 결과 100%의 정확도로 웹 크롤러 서비스가 실행되고 있음을 확인할 수 있었다. 향후 제안된 웹 크롤러 서비스를 적용할 수 있는 웹 페이지 범위를 확대하여 다양한 웹 사이트에 동시에 적용할 수 있도록 개선하면 웹 크롤러 서비스의 양적 내용을 보충할 수 있을 것으로 기대한다. 
2016
2016
This study examines the historical Information Systems research collaboration network. We build the network using co-authorship… 
Review
2016
Review
2016
Computer Science departments typically offer a computer literacy course that targets a general lay audience. At Appalachian State… 
2016
2016
ABSTRACT Though hoaxing people to make financial benefits is an old idea, phishers have realized that social engineering tools… 
2015
2015
The algorithms also preserve important properties of the dataset, which are important for mining operations, and so guarantee… 
Review
2015
Review
2015
The Internet can be considered as a data source (belonging to the vast category of Big Data), that may be harnessed in… 
2015
2015
Up to this point, the applications in this book have been pretty simple. In this chapter, you learn what it will take to create… 
2012
2012
Masyarakat pada umumnya gemar mendengarkan musik baik melalu pc, notebook, maupun melalui perangkat selular. Untuk pengguna… 
2011
2011
In this article, a novel model of Webpage information extraction based on tags is presented. With the ingenious algorithm, the…