Nvidia Triton for OpenShift Source to Image (s2i)

This repo shows how to package a ML model with a Nvidia Triton server container.

Quickstart

Note

In this example Triton server is configured to serve models from:/models

Run Triton - Polling mode (PVC storage)

Note

You can copy models from local storage via oc cp to a PVC or ephemeral storage

oc apply -k gitops/overlays/triton

# change project / ns context
oc project demo-triton

# get pod name
POD=$(oc get pod -l app=triton-server -o custom-columns=POD:.metadata.name --no-headers)

# copy model into /models
oc cp examples/source-builder/models/simple ${POD}:/models/

Run Triton - Use an Init Container to setup model

oc apply -k gitops/overlays/triton-init

Run Triton - Load models from S3 bucket at runtime

Note

Modify triton-s3-models secret with s3 credentials

oc apply -k gitops/overlays/triton-s3

Run Builder Demos

oc apply -k gitops/

More Info

See examples for more details

Links

Triton Walkthrough

Name		Name	Last commit message	Last commit date
Latest commit History 62 Commits
client		client
examples		examples
gitops		gitops
scripts		scripts
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Nvidia Triton for OpenShift Source to Image (s2i)

Quickstart

Run Triton - Polling mode (PVC storage)

Run Triton - Use an Init Container to setup model

Run Triton - Load models from S3 bucket at runtime

Run Builder Demos

More Info

Links

About

Languages

redhat-na-ssa/demo-triton-yolo

Folders and files

Latest commit

History

Repository files navigation

Nvidia Triton for OpenShift Source to Image (s2i)

Quickstart

Run Triton - Polling mode (PVC storage)

Run Triton - Use an Init Container to setup model

Run Triton - Load models from S3 bucket at runtime

Run Builder Demos

More Info

Links

About

Topics

Resources

Stars

Watchers

Forks

Languages