웹데이터 형식
웹상에서는 다음과같은 형식을 많이 제공한다.
XML / JSON / YAML / CSV / TSV / Excel / PDF ...
데이터형식으로는 Text/Binary형식이 있다.
Text
일반적으로 에디터로 편집할 수 있는 데이터포맷 자연어(한국어, 영어, 중국어, 일어 ... )와 숫자로 구성된 데이터
장점
편집을 쉽게 할 수 있고 설명을 포함해서 쓸 수 있기 때문에 가독성이 좋다.
단점
보안성이 떨어지고 바이너리 데이터보다 데이터크기가 크다.
주의점
어떤 문자코드(문자인코딩)로 저장되어있느냐에 따라 다른 의미를 갖게 되므로 같은 문장을 텍스트로 저장할 때 인코딩문제를 해결해 주어야 한다.
보통 UTF -8 방식을 많이 사용한다.
EX) XML / JSON / YAML / CSV ...
Binary
문자와 상관없이 사용할 수 있는 데이터이다.
장점
데이터 크기가 작다.
보안성이 좋다.
단점
에디터로 편집할 수 없다.
어떤 데이터가 있는지 정의를 해서 사용을 해야 한다.
웹상에서는 바이너리 데이터 형식을 많이 사용한다. ( 이미지나 동영상을 볼때 용량이 크면 서버의 부담이 커지기 때문에 )
이미지는 압축률이 좋아야 한다. (JPEG, GIF, PNG )
이러한 이유때문에 바이너리 형식을 사용하는것이 실용적이다.