Буцах: Мэдлэг

2026 оны 5-р сарын 14

Agentic Data Cloud: Google Cloud-ын шинэ архитектур танай дата стратегид хэрхэн нөлөөлөх вэ?

Г.АзжаргалХянасан:Г.Азжаргал· Програм хангамжийн инженер

CTO болон технологийн удирдлагуудад зориулав. Датаг харах бус, бие даан үйлдэл хийдэг Agentic Data Cloud-ын архитектур, эрсдэл, шийдвэр гаргалтад нөлөөлөх хүчин зүйлс.

Google Cloud's New service Agentic Data Cloud
Google Cloud's Enterprise new service: Agentic Data Cloud

Байгууллагын өгөгдлийн сан (Data Warehouse) уламжлалт утгаараа идэвхгүй систем байсаар ирсэн. Мэдээллийн инженерүүд дата дамжуулах пайплайн угсарч, аналистууд түүнийг нь тайлан болгон хувиргасны эцэст хүн харж шийдвэр гаргадаг. Энэхүү уламжлалт урсгал нь найдвартай боловч дата үүсэх болон үйлдэл хийх хоорондын хугацааг (Time-to-action) уртасгадаг сул талтай.

Сүүлийн үед Google Cloud-аас танилцуулж буй Agentic Data Cloud нь энэхүү аргыг өөрчилж байна. Энэ нь зөвхөн асуултад хариулдаг Generative AI-аас нэг алхам урагшилж, өгөгдөл дээр үндэслэн бие даан үйлдэл хийдэг (Agentic) архитектур юм. Технологийн удирдлагууд, үүсгэн байгуулагчид болон архитектуруудын хувьд энэ нь дата платформоо зүгээр нэг хадгалах сав бус, харин байгууллагын үйл ажиллагааны тархи болгон хувиргах боломжийг олгож байна.

Энэхүү нийтлэл нь Agentic Data Cloud яг юу болох, түүнийг хэрэгжүүлэх архитектурын сонголтууд, учирч болох эрсдэлүүд болон уламжлалт арга барилаас хэзээ татгалзах ёстой талаарх практик шийдвэр гаргалтын удирдамж болно.

Agentic Data Cloud хэрхэн ажилладаг вэ?

Agentic Data Cloud
Agentic Data Cloud service - Google Cloud

Agentic Data Cloud-ын цөм нь дата агуулах дотор хиймэл оюуныг шууд байршуулж, түүнд систем хооронд харилцах эрхийг олгосонд оршино. Өөрөөр хэлбэл, LLM-ийг тусдаа үйлчилгээ байдлаар дуудахын оронд, дата өөрөө ухаалаг агенттай нягт уялдаж ажилладаг.

Энэхүү архитектур нь үндсэн дөрвөн бүрэлдэхүүн хэсгээс бүрдэнэ:

  1. Танин мэдэхүйн хөдөлгүүр (Reasoning Engine): Gemini зэрэг өргөн хүрээний мэдээлэл боловсруулах чадвартай (Large context window) загварууд нь датаг ойлгох, төлөвлөх, дараалсан үйлдлүүдийг шийдвэрлэх гол тархи болдог.
  2. Өгөгдлийн суурь давхарга (Data Foundation): BigQuery, AlloyDB болон Spanner зэрэг мэдээллийн сангууд. Агент эдгээр сангаас зөвхөн дата уншаад зогсохгүй, тусгайлан заасан тохиолдолд өгөгдлийн бүтцийг ойлгож шинээр SQL бичих эсвэл дүгнэлтээ буцааж хадгална.
  3. Баталгаажуулалт ба Хайлтын систем (Grounding & Retrieval): Vertex AI Search зэрэг хэрэгслүүдийг ашиглан хиймэл оюуны хий төөрөгдлийг (Hallucination) бууруулж, зөвхөн байгууллагын бодит датанд үндэслэн хариулах нөхцөлийг бүрдүүлдэг.
  4. Үйлдэл гүйцэтгэх давхарга (Function Calling & Extensions): Энэ бол хамгийн чухал хэсэг. Агент зөвхөн дата анализ хийхээс гадна Vertex AI Extensions ашиглан Salesforce рүү хэрэглэгчийн мэдээлэл оруулах, Jira дээр тикет нээх, эсвэл Cloud Run дээрх дотоод API-ийг дуудах чадвартай болдог.

Эдгээр хэсгүүд нэгдсэнээр систем зөвхөн "Өнгөрсөн сард борлуулалт яагаад буурав?" гэсэн асуултад хариулаад зогсохгүй, "Борлуулалт буурсан шалтгааныг олж, нөөц багассан барааны жагсаалтыг гарган, нийлүүлэгч рүү автоматаар и-мэйл илгээх" зэрэг цогц ажлын урсгалын автоматжуулалт-ыг (Workflow automation) гүйцэтгэх боломжтой болно.

Архитектурын загварууд болон үйл ажиллагааны модел

Байгууллагын онцлог болон датаны төлөвшлөөс хамааран Agentic Data Cloud-ыг хэрэгжүүлэх хэд хэдэн архитектурын загвар байдаг. Шийдвэр гаргагчид дараах загваруудаас өөрийн системд тохирохыг нь сонгох хэрэгтэй.

Загвар 1: Идэвхтэй аналитик буюу Туслах агент (Human-in-the-Loop AI)

Энэ нь хамгийн эрсдэл багатай, хэрэгжүүлэхэд хялбар загвар юм. Агент нь BigQuery дэх датанд холбогдож, бизнесийн хэрэглэгчдийн асуусан энгийн үгээрх асуултыг нарийн нийлмэл SQL болгон хувиргадаг. Үүнийг хэрэгжүүлэхэд дата каталог болон мета-датаны тайлбар маш сайн байх шаардлагатай. Агент зөвхөн унших эрхтэй (Read-only) ажиллах бөгөөд эцсийн шийдвэрийг хүн гаргана.

Загвар 2: Эвентд суурилсан автоматжуулалт (Event-Driven Agent Workflow)

Энэхүү загварт дата өөрчлөгдөх үед (жишээ нь, хэрэглэгчийн гүйлгээнд сэжигтэй хандлага илрэх) систем автоматаар Агентыг ажиллуулна. Агент тухайн хэрэглэгчийн түүх, өмнөх гүйлгээний төлөв болон харилцагчийн үйлчилгээний логуудыг цуглуулан анализ хийгээд, шаардлагатай бол гадаад API дуудаж гүйлгээг царцаах үйлдэл хийнэ. Энэ нь микросервис бичихээс илүү уян хатан бөгөөд дүрэмд баригдаагүй (non-linear) шийдвэр гаргалт шаарддаг процессуудад тохиромжтой.

Загвар 3: Дата инженерийн бие даасан удирдлага (Autonomous Data Governance)

Пайплайны хяналт болон өгөгдлийн чанарыг (Data quality) сайжруулахад чиглэсэн загвар. Агент нь дата агуулах руу орж ирж буй шинэ хүснэгтүүдийг тасралтгүй хянаж, эмзэг мэдээлэл (PII) байгаа эсэхийг илрүүлж автоматаар tag хийх, эсвэл эвдэрсэн дата илэрвэл шалтгааныг олж дохио өгөх үүрэгтэй.

Бодит хэрэглээний тохиолдлууд

Технологи нь практик үнэ цэнэ бүтээж байж л утга учиртай болно. Agentic Data Cloud-ийг салбар хамаарахгүйгээр дараах тохиолдлуудад хэрэгжүүлснээр хэмжигдэхүйц сайжруулалт хийх боломжтой.

  • Санхүүгийн нэгтгэл болон Аудит (Financial Reconciliation): Олон төрлийн төлбөрийн системээс ирж буй гүйлгээг тулгах үед алдаа гарвал Агент нь алдааны шалтгааныг олохын тулд гэрээний баримт (unstructured data) болон гүйлгээний датаг (structured data) хослуулан шалгаж, тайлан бэлтгэнэ.
  • Нийлүүлэлтийн гинжин хэлхээний доголдол (Supply Chain Anomaly Response): Агуулахын үлдэгдэл гэнэт дуусах эсвэл цаг агаарын нөхцөл байдлаас шалтгаалан тээвэр саатах үед Агент нь өөр хувилбаруудыг судалж, хамгийн оновчтой нийлүүлэгч рүү захиалга өгөх драфт үүсгэдэг.
  • Хэрэглэгчийн үйлчилгээний динамик шийдэл (Customer Ops): Гомдол гаргасан хэрэглэгчийн мэдээллийг CRM-ээс, бүтээгдэхүүний ашиглалтын түүхийг BigQuery-ээс татаж, тухайн хэрэглэгчид зориулсан тусгай урамшуулал олгох API-г дуудах шийдвэрийг бодит хугацаанд гаргах.

Давуу болон сул талууд: Эрсдэл, хязгаарлалт

Шинэ технологи бүр өөрийн гэсэн trade-off-той байдаг. CTO нарын хувьд технологийн трендийг хөөхөөс илүүтэйгээр эрсдэлийг бодитоор үнэлэх нь чухал юм.

1. Системийн хүлээгдэх хугацаа (Latency vs. Determinism)

Хиймэл оюун ухаан, тэр дундаа LLM нь уламжлалт код (deterministic system) шиг хурдан биш. Нэгэн хэвийн үйлдэл хийхэд зориулж бичсэн Python микросервис хэдхэн миллисекундэд ажиллах бол, Агент датаг уншиж, төлөвлөгөө боловсруулж (reasoning), үйлдэл хийхэд хэдэн секундээс хэдэн минут хүртэл зарцуулна. Тиймээс бодит хугацааны, өндөр ачаалалтай транзакцийн системд (HFT, low-latency API) Агент ашиглах нь тохиромжгүй.

2. Зардлын тодорхойгүй байдал (Cost unpredictability)

Агентууд нь дата баазад чөлөөтэй хандах эрхтэй үед зардлын хяналт маш хэцүү болдог. BigQuery нь скандсан датаны хэмжээгээр төлбөр тооцдог бөгөөд буруу тохируулагдсан Агент хэт ерөнхий асуулт хариулахын тулд хэдэн терабайт өгөгдлийг дахин дахин унших эрсдэлтэй. Шийдэл: Агентын ашиглах Service Account-д дата хандалтын квот тогтоох, эсвэл BigQuery Slot reservation ашиглан зардлыг хязгаарлах шаардлагатай.

3. Хандалтын удирдлага ба Аюулгүй байдал (IAM for Agents)

Агентад API дуудах, дата өөрчлөх эрх өгнө гэдэг нь аюулгүй байдлын цоо шинэ эрсдэл үүсгэдэг. Хэрэглэгчийн Prompt injection халдлагаар дамжуулан Агентаар хортой SQL ажиллуулах эсвэл өгөгдөл устгуулах (Data loss/exfiltration) боломжтой. Тиймээс Агентад хэзээ ч `DELETE`, `DROP`, `UPDATE` зэрэг эрхийг шууд олгож болохгүй. Үргэлж Хамгийн бага эрхийн зарчим (Principle of Least Privilege) баримталж, критикал үйлдлийн өмнө хүний баталгаажуулалт (HITL) шаарддаг байх хэрэгтэй.

4. Хиймэл оюуны төөрөгдөл ба Датаны чанар (Hallucination dependency)

Агент хэчнээн ухаантай байсан ч танай дата каталогийн тайлбар (metadata) муу, өгөгдөл цэвэрлэгдээгүй байвал буруу үр дүн л гаргана. Garbage In, Garbage Out гэсэн зарчим Агентын хувьд илүү ноцтой үр дагавартай. Учир нь Агент буруу дүгнэлтэд үндэслэн буруу үйлдэл (жишээ нь, буруу хэрэглэгчийн эрхийг хаах) хийх эрсдэлтэй.

Шийдвэр гаргах шалгуурууд

Таны баг шинэ процесс хэрэгжүүлэхдээ уламжлалт аргаар хөгжүүлэх үү эсвэл Agentic Data Cloud ашиглах уу гэдгээ дараах харьцуулалтад үндэслэн шийдвэрлэх боломжтой.

  • Уламжлалт Дата Пайплайн (Standard ETL/ELT): Датаны бүтэц тодорхой, өөрчлөлт багатай, бизнесийн логик нь хатуу тогтсон дүрмээр (If-Then-Else) ажиллах үед сонгоно. Өртөг бага, хурд өндөр, найдвартай.
  • Уламжлалт BI болон Дашбоард: Зорилго нь зөвхөн хүнд мэдээлэл харуулах, сар бүрийн тогтмол тайлангуудыг удирдах хэрэгцээтэй үед хангалттай.
  • Custom Microservices: Систем хооронд харилцах шаардлагатай боловч үйлдэл нь маш хурдан (low latency) байх ёстой, эсвэл LLM-ийн уян хатан байдал огт шаардлагагүй үед ашиглана.
  • Agentic Workflow: Асуудлыг шийдвэрлэхийн тулд олон эх сурвалжаас дата нэгтгэх, текст эсвэл зураг зэрэг бүтэцгүй өгөгдлийг задлан шинжлэх, нөхцөл байдалд тааруулан динамик шийдвэр гаргаж гадаад системд хандах шаардлагатай үед сонгоно. Энд найдвартай нэвтрүүлэлт (reliable delivery)-д зориулсан үнэлгээний тогтолцоо чухал.

Түгээмэл алдаанууд ба тэднээс зайлсхийх нь

Инженерийн багууд Agentic Data Cloud-ыг хэрэгжүүлэхдээ гаргадаг хэд хэдэн нийтлэг алдаа байдаг. Үүнд:

  1. Бүхнийг нэгтгэсэн цор ганц Агент бүтээх гэж оролдох: Нэг агентаар бүх дата бааз руу хандаж, бүх API-ийг дуудуулна гэдэг нь системийн эвдрэлийн цэгийг (Single point of failure) томруулдаг. Үүний оронд жижиг, тусгайлсан үүрэгтэй олон агентуудын сүлжээ (Multi-agent orchestration) үүсгэх нь илүү үр дүнтэй бөгөөд хянах боломжтой байдаг.
  2. Бичих эрхийг эрт олгох: Туршилтын шатанд агентад үйлдвэрлэлийн өгөгдлийн санд бичих, эсвэл хэрэглэгчид рүү шууд и-мэйл илгээх эрх олгох нь ноцтой эрсдэл дагуулдаг. Хамгийн зөв арга бол эхлээд агентын гаргасан шийдвэрүүдийг зөвхөн лог хэлбэрээр хадгалж, үнэн зөв эсэхийг нь дүгнэх (Shadow mode)-ээс эхлэх явдал юм.
  3. Мета-датаг үл тоох: Агент нь танай датабаазын хүснэгтүүдийн утгыг шууд тааж чадахгүй. Баганын нэршил болон хүснэгт хоорондын уялдааг тайлбарласан дата каталог байхгүй бол Агентийн гаргах SQL алдаатай байх магадлал эрс өснө.

Гол дүгнэлтүүд

Google Cloud-ийн Agentic Data Cloud нь дата архитектурын хөгжлийн дараагийн үе шат мөн хэдий ч, үүнийг амжилттай хэрэгжүүлэхэд инженерийн нарийн сахилга бат шаардагдана. Дараах зүйлсийг анхаарч ажиллахыг зөвлөж байна:

  • Практик хэрэгжилтээс эхлэх: Шууд бүх процессыг автоматжуулах гэж яаралгүй, зөвхөн унших зориулалттай аналитик агент эсвэл дотоод үйл ажиллагааг дэмжих зорилгоор туршиж эхлээрэй.
  • Тодорхой эзэмшил, хариуцлага: Агентийн хийсэн үйлдлийг хэн хариуцахыг тодорхой болго. Системийн алдаанаас үүдэлтэй санхүүгийн болон өгөгдлийн эрсдэлийг удирдах засаглалын дүрэм журам байх шаардлагатай.
  • Тасралтгүй хөгжил ба Хяналт: Агентийн амжилттай гүйцэтгэсэн үйлдлүүд болон бүтэлгүйтсэн дуудлагуудыг тасралтгүй хянаж, Prompt болон хязгаарлалтын дүрмүүдээ сайжруулснаар урт хугацаанд тогтвортой, найдвартай системийг бий болгоно.

Google Cloud-ийн блог дээрээс энэ үйлчилгээний талаар дэлгэрэнгүй унших бол энд дарна уу.

Нийтлэлд нэгдэх үү?

Танд манай нийтлэл таалагдсан уу? Ийм төрлийн нийтлэлийг долоо хоног бүр имэйлдээ аваарай.

* 200+ хөгжүүлэгчид, менежерүүд, CTO нар бүртгүүлсэн.

Дараагийн Нийтлэл