bác có kênh nào hay tài liệu nào hay ko bác
via theNEXTvoz for iPhone
mấy cái core thì nếu bác đủ kiên trì thì kiếm sách đọc ấy, vì nó là core nên mấy cái kiến thức trong mấy quyển classic nó vẫn value. Còn cloud + tool này nọ thì chủ yếu em xem tutorial nhẹ trên youtube hoặc đọc luôn doc của nó, chứ bản chất DevOps rộng quá nên cũng không có thằng nào đủ cover hết (hoặc em không biết).
1 vài channel, source hay em hay xài chia sẻ cho ae:
devopscube (blogs, tutorial,...)
iximiuz labs (thằng này có đống lab về network với container rất hay, tựa tựa leetcode)
hello interview (sys design, không phải required cho devops nhưng good to know)
repo devops-exercise (luyện pv lý thuyết)
mấy cái blog engineering của big tech, blog devops của VN,...
...
em thấy cái devops roadmap trên devops.sh cũng khá ổn cũng có thể follow, đồng thời bỏ thời gian ra học cert của cloud + k8s cũng ok (nếu cty sponsor)
mấy cái trên follow thì chắc lên được tầm mid, còn lên cao hơn thì em không chắc

Reactions:
kudo28, phucpham1301, nkciam and 2 others
em xài k9s á bác, em thấy navigate này nọ lẹ hơn
Cái này dễ dùng đúng không bác, tại em dev chứ không chuyên hẳn devops
Reactions:
nkciam
Cái này dễ dùng đúng không bác, tại em dev chứ không chuyên hẳn devops
nó là tool trên terminal á bác, theo em đánh giá thì cũng dễ dùng nếu bác quen xài bàn phím để navigate vim các kiểu và có kiến thức cơ bản về k8s. còn nếu không em nghĩ xài Lens hoặc mấy tool UI vẫn ok cho anh em dev hơn
Reactions:
nkciam
Em dev đang học mò devops. Các bác cho em hỏi có cách nào chạy lệnh kubectl qua phần mềm Lens ko nhỉ? Đỡ phải mở cmd
Dễ thôi mike fence ưi

Đây là default terminal windows là Powershell. Tốt nhất nên cài WSL Ubuntu rồi tạo cụm minikube trên đó lab.
mấy cái core thì nếu bác đủ kiên trì thì kiếm sách đọc ấy, vì nó là core nên mấy cái kiến thức trong mấy quyển classic nó vẫn value. Còn cloud + tool này nọ thì chủ yếu em xem tutorial nhẹ trên youtube hoặc đọc luôn doc của nó, chứ bản chất DevOps rộng quá nên cũng không có thằng nào đủ cover hết (hoặc em không biết).
1 vài channel, source hay em hay xài chia sẻ cho ae:
devopscube (blogs, tutorial,...)
iximiuz labs (thằng này có đống lab về network với container rất hay, tựa tựa leetcode)
hello interview (sys design, không phải required cho devops nhưng good to know)
repo devops-exercise (luyện pv lý thuyết)
mấy cái blog engineering của big tech, blog devops của VN,...
...
em thấy cái devops roadmap trên devops.sh cũng khá ổn cũng có thể follow, đồng thời bỏ thời gian ra học cert của cloud + k8s cũng ok (nếu cty sponsor)
mấy cái trên follow thì chắc lên được tầm mid, còn lên cao hơn thì em không chắc
theo cái roadmap kia thì kiến thức là rộng. Đủ để đi làm học hết mớ đấy chắc tẩu hỏa mất

Reactions:
nkciam
theo cái roadmap kia thì kiến thức là rộng. Đủ để đi làm học hết mớ đấy chắc tẩu hỏa mất
mỗi mảng đụng 1 cái popular nhất với không cần quá phải sâu advanced thì em thấy cũng ổn bác
Reactions:
nkciam
Dạo này em cũng mông lung với công việc quá, mong các bác cho em xin tư vấn đường đi nước bước.
- Tên/nickname: Khánh
- Vị trí hiện tại (DevOps/SRE/...): Cloud Engineer
- Đang dùng cloud nào? (AWS/Azure/GCP/on-prem...): AWS
- Toolset chính: (Terraform, Jenkins, K8s,...): Terraform
- Nơi làm việc (nếu tiện chia sẻ): outsourcing - partner hãng
- Gặp sự cố gì khét nhất? Giải sao?
: chưa có handons sự cố khét
- Mong muốn học thêm gì trong năm nay?: Upgrade thêm kiến thức về landing zone + deep dive vào K8S.
Hiện tại em bị mông lung, nếu tiếp tục ngồi partner thì chả học hỏi được gì, suốt ngày chỉ đi làm demo với POC thì chắc hết tuổi nghề vẫn là ếch ngồi đáy giếng mất.
Đồ nhà AWS làm thì em làm thuận tay không vấn đề, nhưng các cái mà em mong muốn liên quan đến DevOps toolset thì gần như ít đụng được. Hi vọng kết nối đến các bác để học hỏi nhiều hơn về DevOps skills.
Reactions:
nkciam
Dạo này em cũng mông lung với công việc quá, mong các bác cho em xin tư vấn đường đi nước bước.
- Tên/nickname: Khánh
- Vị trí hiện tại (DevOps/SRE/...): Cloud Engineer
- Đang dùng cloud nào? (AWS/Azure/GCP/on-prem...): AWS
- Toolset chính: (Terraform, Jenkins, K8s,...): Terraform
- Nơi làm việc (nếu tiện chia sẻ): outsourcing - partner hãng
- Gặp sự cố gì khét nhất? Giải sao?
: chưa có handons sự cố khét
- Mong muốn học thêm gì trong năm nay?: Upgrade thêm kiến thức về landing zone + deep dive vào K8S.
Hiện tại em bị mông lung, nếu tiếp tục ngồi partner thì chả học hỏi được gì, suốt ngày chỉ đi làm demo với POC thì chắc hết tuổi nghề vẫn là ếch ngồi đáy giếng mất.
Đồ nhà AWS làm thì em làm thuận tay không vấn đề, nhưng các cái mà em mong muốn liên quan đến DevOps toolset thì gần như ít đụng được. Hi vọng kết nối đến các bác để học hỏi nhiều hơn về DevOps skills.
devops hình như ít khi được làm ngay từ đầu phải không bác
Reactions:
MinnhNhat and nkciam
thớt hẻo quá, vote del
Cám ơn bác quan tâm topic. Bác comment đóng góp cho ae học hỏi với nào

thớt chả có tý giá trị gì, vô thớt review lương vui hơn
via theNEXTvoz for iPhone Thấy thớt hơi chìm, đá lên phát. Liên quan thì có bác nào xài NixOS không, cho em hỏi muốn setup luồng CI/CD trên đó thì làm như nào nhỉ? Em đang làm kiểu hơi "chuối" tí là
- Đẩy code
- Webhook kích hoạt job pull code + build image
- Restart service đang dùng docker image
Cũng muốn tự viết Nix package cho đúng tinh thần reproducible, cơ mà dính ngay quả service NodeJS không cache chuẩn bị build đi build lại + nếu theo hướng này thì cái webhook phải cầm code + sửa hash + commit ngược lại khá phiền nên em mới đành xài cách trên

Reactions:
nkciam
Giờ học network admin rồi lên devops có được không các bác, hay là em học từ backend lên devops sẽ ok hơn ạ
xin hỏi anh em devops tí về monitoring
phần display data thì phổ biến nhất chắc là grafana rồi
còn phần lấy data thì minh nên chọn những thằng bao sân như opentelemetry(tracing, metrics, logging,...) hay chọn những thằng chuyên biệt như jaeger cho tracing, prometheus cho metrics
xin hỏi anh em devops tí về monitoring
phần display data thì phổ biến nhất chắc là grafana rồi
còn phần lấy data thì minh nên chọn những thằng bao sân như opentelemetry(tracing, metrics, logging,...) hay chọn những thằng chuyên biệt như jaeger cho tracing, prometheus cho metrics
Thường là promethus bác, mấy cái opentelemetry, jaeger advance hơn r khá khó để bắt đầu
Reactions:
Resa
cùng học DevOps với real world issue:
I’m running a NestJS app in ECS (Fargate). When I deactivate a task and ECS starts draining connections, it takes ~5 minutes before my app receives the SIGTERM signal. During this time, all background jobs are still running.

ECS event log:
01:36 - Task started draining connections

App log:
01:41 - SIGTERM The service is about to shut down!
Here’s the Dockerfile I use (multi-stage Node 22):
# Builder Image
FROM node:22-alpine AS builder
RUN corepack enable && corepack prepare
[email protected] --activate
WORKDIR /app
COPY package.json pnpm-lock.yaml ./
RUN pnpm install
COPY . .
RUN pnpm build
RUN NODE_ENV=production pnpm install --frozen-lockfile --prod
# Runner Image
FROM node:22-alpine
RUN corepack enable && corepack prepare
[email protected] --activate
WORKDIR /app
COPY --from=builder /app .
EXPOSE 3000
CMD ["sh", "-c", "pnpm prisma migrate deploy && node dist/main"]
And my app handles shutdown:
process.on('SIGTERM', () => {
console.log('SIGTERM The service is about to shut down!');
});

Questions:
Is this ECS behavior expected?
Why I always keep getting receiving SIGTERM after 5 minutes? What causes it?
How can I get SIGTERM earlier to gracefully stop background jobs?
Team mình đang mở rộng dự án, cần vài ae Devops cứng 5ye+, tiếng anh 100% cần lưu loát để họp trực tiếp khách hàng có cả CTO/TL, làm freelance/full remote, 2nd job, trả lương net USD, thời gian làm việc tự do nhưng có thể cần meeting trong khoảng 18h-2h sáng (khách hàng EU, US)
JD không cố định, do team này outsource nhiều project, chỉ cần solid 1 số common skill trong list là oke
Cloud: các loại, có cert càng tốt
CICD: các loại, ưu tiên Jenkins
IaC: terraform terragrunt pulumi
K8S,Docker: viết chart, viết crd ,deploy, vận hành, optimize, tuning, troubleshoot
Monitoring+tracing+alert: promstack, otel, mimir, thanos
Network: vpc, vpn, s2s, tailscale, cloudflare
Scripting: shell, ps, python
Domain khác như AI Data Blockchain là điểm cộng
Common concept: Zero downtime deploy, security, backup/restore, disaster recovery, encryption …
Ae nào HCM hứng thú ib nhé
Reactions:
minhthcvb, l2okatme and 100