분류 전체보기 76

데이터 시각화 2

1) 차원에서 메뉴명을 텍스트 마크에, 칼로리를 색상과, 크기 마크에 각각 놓으면 (측정값: 합계) 칼로리 합계에 따라 색상과 메뉴명 사이즈가 상이한, 워드 클라우드를 표현할 수 있다. 2) 카페인 합계에 따라 색상 표현, 마크의 모양은 원으로 설정한 뒤 메뉴명은 세부정보로 설정. 화면 좌측상단 분석탭의 박스플롯을 작업화면에 드래그하면 위와 같은 시각화를 표현할 수 있음. 3) 칼로리를 열에, 카테고리를 행에 두고 카페인 평균함량을 활용하는 계산식을 IF구문을 활용하여 생성한 뒤, 이를 색상 마크에 표현하면 평균 칼로리 함량 80mg을 기준으로 2가지 색상으로 분리되어 나타나는 시각화를 표현할 수 있음. 4) 매장운영시간을 열에, 매장명을 행에 두고 DATEDIFF 함수를 활용하여, 매장 운영시간을 계산..

Leetcode 262 - Trips and Users

https://leetcode.com/problems/trips-and-users/description/ 습득한 점: SUM함수의 새로운 표현법을 알 수 있었다. 이제 까진 주로 숫자에 대한 계산을 위해 SUM(price*moment) 의 정도로 활용해왔지만, 이번 문제 풀이를 통해, 컬럼 내 존재하는 특정 문자열 데이터의 갯수를 아래 표현과 처럼 셀 수도 있었다. SUM(status != 'completed') >>> status 컬럼 중 "completed"가 아닌 데이터의 총 갯수 COUNT(status) >>> status 컬럼의 데이터 갯수 총합 문제: The cancellation rate is computed by dividing the number of canceled (by client ..

프로그래머스 Lv 3 - 자동차 대여 기록에서 대여중 / 대여 가능 여부 구분하기

https://school.programmers.co.kr/learn/courses/30/lessons/157340 습득한 점: 레벨 3문제지만, 코드 길이에 관계없이 지금까지 풀었던 문제중에서 가장 까다로웠고, 깨닫게 된 점이 많았다. 문제를 마주하면 이해하기 좋은 코드 작성하고자, 반복적으로 필요하지 않고 해당 함수가 꼭 필요하지 않음에도, With 구문을 습관적으로 활용해서 문제를 풀곤 했었다. 덕분에 이해하기는 편했으나, 코드 줄 수가 너무 길어지는 단점이 있었다. 결과적으론... 이해하는 것이 코드를 작성한 나만 쉽지 않을까? 생각들었다. DA가 sql 코드 성능을 신경 쓸 필요는 별로 없겠지만, 그래도 기존에 해왔던 파이썬이나 자바처럼 좀 더 컴팩트하게 작성하면 좋지 않을까? 앞으로는 가독성도..

프로그래머스 Lv 4 - 보호소에서 중성화한 동물 (Lv 4 문제 마지막)

https://school.programmers.co.kr/learn/courses/30/lessons/59045 습득한 점: WHERE ~ IN () 처럼, LIKE IN () 도 가능할까 싶었는데, 불가능했다. 대신 아래처럼 AND를 전체로 묶은 뒤, 안쪽을 OR로 엮어줄 수는 있었다. ... WHERE SEX_UPON_INTAKE LIKE 'Intact%' AND (SEX_UPON_OUTCOME LIKE 'Spayed%' OR SEX_UPON_OUTCOME LIKE 'Neutered%') ... 문제: 보호소에 들어올 당시에는 중성화1되지 않았지만, 보호소를 나갈 당시에는 중성화된 동물의 아이디와 생물 종, 이름을 조회하는 아이디 순으로 조회하는 쿼리 작성. 즉, 들어올 땐, 중성화X, 나갈땐 중성..

프로그래머스 Lv 4 - 식품분류별 가장 비싼 식품의 정보 조회하기

https://school.programmers.co.kr/learn/courses/30/lessons/131116 습득한점: *** LIMIT은 서브쿼리에 들어가면 쿼리 실행자체가 안된다는 점 *** GROUP BY된 상태로 SELECT 함수 인자로 MAX func 활용할 때, 각 그룹의 첫번째 값이 끌려올 뿐, MAX func가 적용되지 않는 점 문제: FOOD_PRODUCT 테이블에서 식품분류별로 가격이 제일 비싼 식품의 분류, 가격, 이름을 조회하는 쿼리작성. 이때 식품분류가 '과자', '국', '김치', '식용유'인 경우만 출력. 결과는 식품 가격을 기준으로 내림차순 정렬. 문제파악: 각 카테고리(식품분류)에서 최대값을 나타내는 식품명(PRODUCT_NAME)을 찾아야 하는데, '면' 그룹내 P..

구글 colab 시각화, MAC OS 폰트설정

아래 코드 삽입 후, 실행 #폰트 설정 import matplotlib.font_manager as fm import os # apt-get : 패키지 설치 명령어 # -qq : 에러외의 메세지 숨기는 옵션키 !apt-get -qq install fonts-nanum fe = fm.FontEntry( fname=r'/usr/share/fonts/truetype/nanum/NanumGothic.ttf', # ttf 파일이 저장되어 있는 경로 name='NanumGothic') # 이 폰트의 원하는 이름 설정 fm.fontManager.ttflist.insert(0, fe) # Matplotlib에 폰트 추가 plt.rcParams.update({'font.size': 9, 'font.family': 'Na..

불량 제품 분류모델 생성, PDA

✻ "데이터 스테이션" 님의 공정데이터 분석 강좌 내용을 개인 학습한 게시물임을 명시합니다 . (원본 raw데이터 포함 X) 불량 분류모델 구성 https://colab.research.google.com/drive/1_pH3XE9apUDMjEAdH7TA0XDU70PdPbA1?usp=sharing 특성공학 for 성능 향상 https://colab.research.google.com/drive/1q3c1uu0lB1ehg5V7ZvGS32yqlLrSu75O?usp=sharing 알고리즘 성능비교를 통한 적정모델 찾기 https://colab.research.google.com/drive/15nrWUpyH8N1pyTYnRlvA8s8K1OycVOR1?usp=sharing Under Sampling을 통한 비율 ..

통계적 가설 검정, CDA

✻ "데이터 스테이션" 님의 공정데이터 분석 강좌 내용을 개인 학습한 게시물임을 명시합니다 . (원본 raw데이터 포함 X) 설비별 공정시간 차이 https://colab.research.google.com/drive/19_tmx2vJ7X4dj5yteeGxRWde8Qiwc4ll?usp=sharing 설비별 공정안정여부 차이 https://colab.research.google.com/drive/12EgSWDq2LwmQgKPDiHxjCSqb9iZGlCTT?usp=sharing 공정 경로별 불량갯수 차이 https://colab.research.google.com/drive/1xnUirZZipj83bPkEH679HbxzeP2f4jl2?usp=sharing 오류 종류 별 설비 정지시간에 유의미한 차이가 있을까..

데이터 시각화

✻ "데이터 스테이션" 님의 공정데이터 분석 강좌 내용을 개인 학습한 게시물임을 명시합니다 . (원본 raw데이터 포함 X) 주요인자 탐색 https://colab.research.google.com/drive/1dtzPl6kdigtuwCKgoNQS8CWylGlrPE-N?usp=sharing 공정경로별 부하랑 https://colab.research.google.com/drive/1ZLP2FtsL08dR2ethBSwdU1FTDpKDfNOw?usp=sharing 관리도 https://colab.research.google.com/drive/1Egne71KLGtIDE1wEmwS-t_2QUJZPpoJD?usp=sharing 파레토 https://colab.research.google.com/drive/1X37..

반도체 전공정 데이터 EDA & 전처리

✻ "데이터 스테이션" 님의 공정데이터 분석 강좌 내용을 개인 학습한 게시물임을 명시합니다 . (원본 raw데이터 포함 X) 인자탐색 https://colab.research.google.com/drive/1PrBjO4wg5Z6vAE4zv8DYLZ5HsALzwRJA?usp=sharing 이상치 제거 https://colab.research.google.com/drive/13jEHWP9mpOq5hWcw8a5hrYiW2Dd6bvxq?usp=sharing 파생 변수 생성 https://colab.research.google.com/drive/1Z66wzp8ONbT5HSRZSUMVo_saBFW37UpM?usp=sharing 결측값 처리 https://colab.research.google.com/drive/1w..