본문 바로가기

STUDY

(13)
[자격증] AICE PROFESSIONAL 텍스트토크나이징- 노이즈 캔슬링: 띄어쓰기 체크- 토크나이징: 말뭉치를 토큰 단위로    - POS 태킹: 품사 판별    - 필터링: 불필요한 단어 제거 벡터 표현- BOW (Bag of Words): 단어 빈도만 포커스    - DTM (Document-Term matrix): 단어들의 빈도 행렬    - TF-IDF (Term Frequency-Inverse Document Frequency): 단어의 중요도를 계산하여 표현- One-hot-encoding 표현: 차원 커지고 유사성 표현 X- Dense/Distributed representation: N차원 공간 벡터로 의미적 유사성 표현- 코사인 유사도: 문서의 유사도 구함 임베딩- 워드 임베딩: 자연어를 좌표평면 위에 표현, 희소표현 -> 밀..
[자격증] 빅데이터 분석 기사 실기 준비 실기환경작업형1: 문제 풀이 후 답안 제출, 답안만 채점하므로 만점 or 0점, 3문항작업형2: 예측 결과를 CSV 파일로 제출, 코드 점수는 없는데 구간별 점수작업형3: 1과 마찬가지, 2문항 판다스 활용- dir(pd): 판다스 함수명- help(pd.함수명): 함수 사용 방법 및 예시 코드사이킷런 활용- sklearn.__all__: 사이킷런 함수명- dir(preprocessing): 전처리 함수명- help(preprocessing.함수명): 함수 사용 방법 및 예시 코드사이파이 활용- dir(stats): 전처리 함수명- help(stats.함수명): 함수 사용 방법 및 예시 코드 작업형1판다스(pandas)- df.to_csv('temp.csv')- pd.read_csv('temp.csv')..
[자격증] ADsP 준비 데이터 이해데이터의 이해- 존재적 특성, 당위적 특성- 정성적 데이터, 정량적 데이터- 지식경영의 핵심 이슈: 암묵지, 형식지- SECI 모델    - 공화: 암묵 -> 암묵    - 표출화: 암묵 -> 형식    - 연결화: 형식 -> 형식    - 내면화: 형식 -> 암묵- DIKW 피라미드    - Data(데이터): 객관적 사실    - Information(정보): 데이터간 연관관계&의미도출    - Knowledge(지식): 정보를 구조화&일반화    - Wisdom(지혜): 깊은이해 -> 창의적 아이디어- 바이트 크기: KMGT PEZY(페타, 엑사, 제타, 요타)- 데이터베이스의 특징    - 통합된 데이터: 중복X    - 저장된 데이터: 저장 매체에 저장    - 공용 데이터: 여러 사..
[자격증] 정보처리기사 실기 준비 코드-포인터, 오버라이딩 빈출 JAVA- new를 통해 새로운 주소값을 생성하면 a==b가 false- 오버로딩: 메소드명은 같지만 매개변수의 개수나 타입이 다름- 오버라이딩: 메소드명, 매개변수, 리턴 값이 모두 같아야함- void: 아무 출력이 없는 메서드- static: 모든 인스턴스 공유, 클래스 자체에 종속, 그래서 바로 호출 가능 C언어- *배열: 배열의 첫번째 값 반환 (여기서 배열에 +1을 하면 1을 더한게 아니라 다음 값, 이것도 사실 포인터)- &변수: 변수의 주소- '\0': 문자열 끝을 의미 (문자열 크기가 문자 길이보다 클 수가 있음)- 포인터 연산자(->): 구조체(struct) 포인터가 가르키는 구조체 멤버에 접근 (*로 포인터 변수 선언했으면 이걸 쓴다고 보면 됨)- if(조..
[자격증] DAsP 준비 전사아키텍처 이해전사아키텍처 개요- 뷰: 비즈니스 아키텍처, 애플리케이션 아키텍처, 데이터 아키텍처, 기술 아키텍처- 관점: 계획자(개괄적), 책임자/분석자(개념적), 설계자(논리적), 개발자(물리적)- 사례: ZEAF, FEAF, TEAF, DoDAF, TOGAF, 공공부분EAF- 참조 모델: 성과 참조 모델 (PRM), 업무 참조 모델 (BRM), 서비스 참조 모델 (SRM), 데이터 참조 모델 (DRM), 기술 참조 모델 (TRM)- EA 비전 수립 - EA 구축 - EA 관리 정의 - EA 활용 정의전사아키텍처 구축- EA 기본 원칙: 업무 지향, 성과 지향, 고객 지향, 상호운용- 현행 아키텍처, 목표 아키텍전사아키텍처 관리 및 활용- IT 기획 관리, IT 구축 관리, IT 운영 및 통제데이터..
[자격증] 빅데이터 분석 기사 필기 준비 * 암기할 부분을 위주로 정리* 기본적이라 생각되는 부분이나 비효율적인 부분은 과감히 생략 빅데이터 분석 기획빅데이터의 이해- DIKW 피라미드    - Data(데이터): 객관적 사실    - Information(정보): 데이터간 연관관계&의미도출    - Knowledge(지식): 정보를 구조화&일반화    - Wisdom(지혜): 깊은이해 -> 창의적 아이디어- 바이트 크기: KMGT PEZY(페타, 엑사, 제타, 요타)- 빅데이터 특징: 3V - 5V - 7V (순서대로 추가)    - Volume(규모), Variety(다양성), Velocity(속도)    - Veracity(신뢰성), Value(가치)    - Validity(정확성) Volatility(휘발성)- 빅데이터 유형: 정형 데..
[자격증] SQLP 준비 - 3과목 SQL 고급활용 및 튜닝 (개정 전) SQL 고급활용 및 튜닝아키텍처 기반 튜닝 원리- 서버간 연결상태를 유지하면 서버 자원을 낭비하지만 SQL을 수행할 때 마다 연결 요청을 반복하면 서버 생성과 해제를 반복하므로 성능에 좋지 않아 OLTP성 애플리케이션에서는 Connection Pooling 기법 활용- 요청에 대한 부하는 쓰레드 기반보다 프로세스 기반이 더 심함- 전용 서버 방식 (Dedicated Server) : 연결 요청을 할 때마다 서버 생성- 공유 서버 방식 (Shared Server) : 직접 통신하지 않고 Dispatcher 프로세스를 거침 - 블록(페이지) : 데이터를 읽고 쓰는 단위- 익스텐트 : 데이터파일에 공간을 할당하는 단위- 익스텐트 내 블록들은 서로 인접하지만, 익스텐트끼리는 서로 인접하지 않음- 한 익스텐트에 ..
[데이터] GIS 지리정보체계 (GIS, Geographic Information System) 데이터 유형- 레스터 (Raster) : 정사각형 픽셀(Pixel)로 구성- 벡터 (Vector) : 점(Point), 선(Line), 면(Polygon)으로 구성 데이터 구조- Feature : 실세계의 객체들- Geometry : 위치 정보- Attribute : 속성 정보 쉐이프 파일 (Shapefile)- *.shp : Feature Geometry- *.dbf : Feature Attribute- *.shx : Feature Geometry의 색인(index)- *.prj : 좌표계 정보- *.sbn과 *.sbx : 피처의 공간 인덱스 (sptial index)- *.xml : 메타데이터 (Metadata) QGIS ..