Skip to search formSkip to main contentSkip to account menu

Byte pair encoding

Known as: Byte pair compression, Digram coding, Dual tile encoding 
Byte pair encoding or digram coding is a simple form of data compression in which the most common pair of consecutive bytes of data is replaced with… 
Wikipedia (opens in a new tab)

Papers overview

Semantic Scholar uses AI to extract papers important to this topic.
2019
2019
In this paper, we propose a refined multi-stage multi-task training strategy to improve the performance of online attention-based… 
2019
2019
A major challenge for neural machine translation (NMT) models is truly understanding semantics, creating common issues such as… 
2018
2018
다중 문서 제목 추출은 하나의 주제를 가지는 다중 문서에 대한 제목을 추출하는 것을 말한다. 일반적으 로 다중 문서 제목 추출에서는 다중 문서 집합을 단일 문서로 본 다음 키워드를 제목 후보군으로 추출하 고, 추출된 후보를 나열하는 형식의 연구가 많이 진행되어져 왔다. 하지만 이러한 방법은 크게 두 가지의 한계점을 가지고 있다. 먼저, 다중 문서를 단순히 하나의 문서로 보는 방법은 전체적인 주제를 반영한 제 목을 추출하기 어렵다는 문제점이 있다. 다음으로, 키워드를 조합하는 형식의 방법은 키워드의 단위를 찾 는 방법에 따라 추출된 제목이 자연스럽지 못하다는 한계점이 있다. 따라서 본 논문에서는 이 한계점들을 보완하기 위하여 단어 관련성 추정과 Byte Pair Encoding을 이용한 요약 기반의 다중 뉴스 기사 제목 추 출 방법을 제안한다. 평가를 위해서는 자동으로 군집된 총 12개의 주제에 대한 다중 뉴스 기사 집합을 사 용하였으며 전문 교육을 받은 연구원들이 정성평가를 진행하여 5점 만점 기준 평균 3.68점을 얻었다. 
2017
2017
Factored neural machine translation (FNMT) is founded on the idea of using the morphological and grammatical decomposition of the… 
2017
2017
Recent many password guessing algorithms based on the Probabilistic Context-Free Grammars (PCFGs) model brought significant… 
2016
2016
Most existing Neural Machine Translation models use groups of characters or whole words as their unit of input and output. We… 
2014
2014
Byte pair encoding (BPE) algorithm was suggested by P. Gage is to achieve data compression. It encodes all instances of most… 
2010
2010
In this paper, a new lossless data compression method that is based on digram coding is introduced. This data compression method… 
2006
2006
2002
2002
Summary form only given. We consider string searching in compressed texts. We utilize a compression method related to static…