분류 전체보기75 [WEEK2] Unsupervised Learning in Python 두번째 주가 끝났다. 비지도학습과 클러스터링, 차원 축소 방법에 대해서 배웠다. 수학적인 내용이 많아서 '역시 수학이..' 싶었던 일주일이였고, 마지막에 추천시스템까지 다뤄서 쉽지 않은 코스였다. 수학 공부해야지 + 이번주는 NMF 적용할 수 있는 데이터셋 찾아서 연습. (아마도 영화 줄거리 위키..?) 1. Clustering for dataset exploration - Unsupervised learning, clustering (K Means) - Evaluating a clustering - Transforming features for better clustering 2. Visualization with hierarchical clustering and t-SNE - Visualizing h.. 2021. 9. 7. [캐글] 첫번째 노트북 발행 - Fish Market 캐글에 있는 Fish Market이라는 데이터셋으로 생애 첫번째 노트북을 썼다. 이 데이터셋과 연관된 Task는 두개였는데, 물고기의 무게 예측이랑 물고기 종 예측 중 난 무게 예측을 해봤다. 비록 간단한 회귀문제였지만, 처음으로 스스로 score을 낸 문제라서 기쁨 😙 이번주에 배운 데이터캠프 내용으로 다음주도 새로운 데이터셋을 풀어봐야겠다. - EDA 매우 중요한 것 같은데, 통계적 베이스가 너무 부족하다는 것을 느꼈다. - 어떻게 하면 score을 더 올릴 수 있을지 고민했다. (현재 95%) - Outlier data를 어떻게 처리할 수 있을까? = 혼자만 다른 경향을 갖고있는 물고기 종류. 2021. 9. 5. DataCamp ML Scientist 참고 자료 DataCamp의 ML Scientist 과정을 들으면서, Andrew Ng Deeplearning.ai 코스를 함께 듣고 있다. ML Scientist에서 다루는 내용이 되게 많은데, 원리에 대한 설명이 부족한 경우가 있어서 구글링이나 유튜브로 개념을 더해줘야 한다. 참고해서 공부한 링크들을 나중에 찾아보기 편하도록 정리해두었다. https://docs.google.com/document/d/1Y6pr4eNQRj8EuCLW94j58edu7HQeRLuQRwou2TtQDDs/edit?usp=sharing DataCamp_ML Scientist Syllabus WEEK1 Supervised Learning with sklearn About sklearn train_test_split module https:.. 2021. 9. 2. [WEEK1] Supervised Learning with scikit-learn 스터디 첫 주가 끝났다. 지도학습의 전반적인 내용과 sklearn 사용법에 대해 배웠다. 1. Classification: classification problems using supervised learning techniques. - Supervised Learing = using already labeled data - Numerical / Visual EDA = pandas, seaborn - k-Nearest Neighbors Algorithm = setting a decision boundary - Measuring model performance - Train/test split = split data for training the model, testing - Overfitting and .. 2021. 8. 31. [링크] The Beginner’s Guide to Kaggle elitedatascience.com/beginner-kaggle The Beginner's Guide to Kaggle In this guide, we'll cover everything beginners need to know about getting started on Kaggle. Plus, we'll share our 7 favorite tips for enjoying Kaggle. elitedatascience.com 2021. 1. 31. [링크] My Machine Learning Journey and First Kaggle Competition towardsdatascience.com/my-machine-learning-journey-and-first-kaggle-competition-fcb57523d614 My Machine Learning Journey and First Kaggle Competition How i started Data Science and First Experience. towardsdatascience.com 2021. 1. 30. [링크] AI, Deep Learning and Big Data are Eating the Biotech World medium.com/frenchtech/ai-deep-learning-and-big-data-are-eating-the-biotech-world-6c3a09bc85b4 AI, Deep Learning and Big Data are Eating the Biotech World The biotech world is not the same as it was just five years ago. Technologies like artificial intelligence, deep learning and big data have… medium.com The life sciences industry is especially challenging in that it involves a much longer lead .. 2021. 1. 30. [Python] csv 파일에서 특정 단어를 가진 열 찾아보기 import csv def csv_word(filename, word): f = open(filename, 'r') content = csv.reader(f) found = [] for line in content: if isinstance(word, str): if word in line: found.append(line) else: if len(set(word) & set(line)) == len(word): found.append(line) final = '' for item in found: final += str(item) + '\n' return final if len(found) != 0 else f"'{word}' doesn't exist" → 두번째 인자로 str을 받으면 그 단어를 포함.. 2020. 4. 22. 이전 1 2 3 4 5 6 7 ··· 10 다음