En animación se suele trabajar con las voces de los personajes pregrabadas. Los actores realizan las locuciones y el montador de sonido transfiere su contenido a la carta de rodaje por medio de un aparato lector de la banda de sonido que le permite "leer" sílaba a sílaba el contenido de la locución y saber su longitud en fotogramas.
Con esa información, el animador conoce la duración del diálogo y su transcripción silábica fotograma a fotograma.
A partir de ahí, el animador debe conseguir que el personaje refleje de un modo convincente todo el contenido dramático del texto.
En los ejemplos siguientes el personaje dice las mismas palabras, pero con un contenido emocional absolutamente distinto: "... What are you doing?" En el primero increpa duramente a su interlocutor, mientras que en el segundo le pregunta en actitud amable. La actitud de su cuerpo, su gesto, su pose, la expresión de su cara nos ayudan a ver con claridad la diferencia de las dos tomas de diálogo debido a que el tono en la locución será evidentemente distinto.