본문 바로가기

데이터셋2

타이타닉 데이터셋 1. 타이타닉 데이터셋 타이타닉 데이터셋은 역사적인 타이타닉호의 승객 정보에 관한 데이터입니다. 이 데이터셋은 기계 학습 및 데이터 분석을 연습하기 위한 대표적인 예제로 많이 사용됩니다. 주로 생존 여부와 관련된 문제로 사용되며, 승객의 여러 특성에 대한 정보를 포함하고 있습니다. Survived (생존 여부): 0이면 사망, 1이면 생존. Pclass (티켓 등급): 1, 2, 3 등급이 있음. Name (이름): 승객의 이름. Sex (성별): 남성 또는 여성. Age (나이): 승객의 나이. SibSp (형제자매 또는 배우자 수): 함께 탑승한 형제자매 또는 배우자의 수. Parch (부모 또는 자녀 수): 함께 탑승한 부모 또는 자녀의 수. Ticket (티켓 번호): 승객의 티켓 번호. Fare.. 2023. 12. 26.
사이킷런/아이리스 데이터셋 예제 1. 사이킷런(Scikit-learn) 사이킷런(Scikit-learn)은 파이썬에서 사용할 수 있는 머신러닝 라이브러리 중 하나로, 간단하고 효과적인 도구들, 다양한 샘플 데이터를 제공하여 머신러닝 모델을 만들고 평가, 검증하는 데 사용됩니다. BSD 라이선스이기 때문에 무료로 사용 및 배포가 가능합니다. https://scikit-learn.org/stable/ scikit-learn: machine learning in Python — scikit-learn 1.3.2 documentation Model selection Comparing, validating and choosing parameters and models. Applications: Improved accuracy via parame.. 2023. 12. 24.