Corpus ID: 110750429

중첩된 버킷을 사용하는 다차원 히스토그램에 대한 개선된 알고리즘

@inproceedings{2003,
  title={중첩된 버킷을 사용하는 다차원 히스토그램에 대한 개선된 알고리즘},
  author={문진영 and 심규석},
  year={2003}
}
  • 문진영, 심규석
  • Published 2003
  • Engineering
  • 히스토그램은 최근들어 많은 관심을 끌고 있다. 히스토그램은 주로 상용 데이타베이스 관리 시스템에서 질의 최적화를 위해 속성의 값에 대한 데이타 분포를 추정하는데 사용되었다. 최근에는 근사 질의와 스트림 데이타에 대한 연구 분야에서 히스토그램에 대한 관심이 커지고 있다. 관계형 데이타베이스에서 두 개 이상의 속성에 대한 결합 데이타 분포를 근사시키는 가장 간단한 방법은 각 속성의 데이타 분포가 결합 데이타 분포에 독립적이라고 가정하는 속성 값 독립(Attribute Value Independence: AVI) 가정하에서 각각의 속성에 대해서 히스토그램을 만드는 것이다. 그러나 실제 데이타에서 이 가정은 잘 맞지 않는다. 따라서 이 문제를 해결하기 위해서 웨이블릿, 랜덤 샘플링, 다차원 히스토그램과 같은 기법들이 제안되었다. 그 중에서 GENHIST는 실수형 속성에 대한 데이타 분포를 근사시키기 위해 고안된 다차원의 히스토그램이다. GENHIST… CONTINUE READING

    Create an AI-powered research feed to stay up to date with new papers like this posted to ArXiv