본문 바로가기

Data Science/Basic5

온톨로지는 뭘까. 1. 온톨로지란 무엇일까?어디서 온 온톨로지일까. 왜 팔란티어는 핫하고, 우리 회사는 이걸 하고 싶어할까. 궁금증이 생겼다.팔란티어가 성공적으로 온톨로지를 활용한 이유는 국방·보안·정부 기관처럼 매우 복잡한 데이터를 처리하는 환경에서 강력한 성능을 발휘했기 때문이다.하지만 모든 기업이 팔란티어처럼 온톨로지를 활용할 수 있을까? 그리고, 온톨로지는 뭘까?1. 온톨로지 정의온톨로지(Ontology) = Ontos(존재) + logia(탐구, 학문)→ 존재하는 것에 대한 탐구와 학문, 즉 존재에 대한 탐구이다. 존재를 탐구하는 것은 어떤 것일까?한 존재에 대해 여러 측면으로 들여다 보는 것으로 이해했다.존재한다는 것은 실재하는 세계가 있다는 것이고, 세계와 어떤 연결고리가 있다는 것이다.너무 철학적이니까 조금.. 2025. 2. 2.
지표를 설계해보자 이전 시리즈에서는 지표가 무엇인지, 지표란 어떤 것인지 살펴보았는데요.(자세한 내용은 요기를 눌러주세요!)오늘은 그 지표를 설계해보겠습니다. 아래 예시는 모두 가상입니다:)1. 망곰이네 베이커리🧸🧁 망곰이네 베이커리는 AI 시대에 발맞춰 스마트 베이커리 시스템을 도입하고 싶습니다.테스트를 위하여 버터 발주 자동화 시스템을 먼저 도입하기로 했습니다.먼저, 망곰이네가 발주 시스템을 도입하려는 이유부터 찾아봅시다. 2. 망곰이의 고민🐻🤔망곰이네는 역사가 깊은 베이커리 입니다. 재고 파악을 수기로 정리하고 있었는데요.그러다 보니 발주 프로세스에 문제가 생겼습니다.자꾸 재고 파악이 잘못되거나, 빵이 남는 일이 많았습니다.운영일지를 파악하지 못해서 다음 근무자가 또 발주를 하는 등의 실수가 벌어졌죠.  망곰.. 2024. 11. 10.
지표, 넌 누구니? 지표, 필요해?오늘은 "지표"에 대한 이야기를 해보고자 합니다.데이터를 다루는 사람으로서, 저는 주로 RMSE, R2와 같은 모델 평가 지표들을 활용해 왔습니다.부끄럽게도 서비스를 위한 지표는 사용하고 있지 않았습니다. 현재 재직 중인 회사에서는 특히 실용적인 접근을 중시하여, 작동하는 프로그램 개발에 우선순위를 두었습니다.분석 결과를 모델링하고, 정해진 일정 내에 개발 환경을 구축하는 것이 주요 과제였죠. 개발 환경을 구축하고, 배포한 후 사용자들의 많은 피드백을 들었습니다.제가 제대로 설명하지 못하거나, 이해관계자들이 이해할 수 있는 요소들이 너무 적었습니다. 서로가 서로를 답답해하는 상황이 이어졌죠.사용자가 이해할 수 없는 프로젝트가 되었고, 자연스레 서비스 퍼포먼스가 생각한 것만큼 좋지 못했습니다.. 2024. 10. 27.
Pytorch Tutorial (1) _ Tensor Tensor Tensor란 pytorch의 자료형으로, 단일 데이터 타입으로 된 자료들의 다차원 행렬이다. 이를 이용하여 GPU 연산을 수행한다. data : list, ndarray 등의 data type dtype : array 내부의 데이터 타입 (ex.float32, int64...) device: default=None, CPU or GPU requires_grad : default=False, gradient 값 저장 유무 더보기 [오류가 난다면 생각해 볼 것!] ✅ Tensor로 변환되는 데이터인가? ✅ 연산할 tensor 간 dtype이 같은가? ✅ 연산할 tensor가 같은 device에 올라가 있는가? 1. torch.tensor() tensor 변환 시, 새 메모리를 할당한다. ten.. 2022. 6. 5.